下棋怎么样下过电脑(今天,我们来教AI下国际象棋)
编辑:陈萍
国际象棋是一种在棋盘上玩的双人战略棋盘游戏,棋盘格式为64格,排列在8×8网格中。有人无聊的时候会找电脑下国际象棋,但也有人无聊了会教电脑下棋。
国际象棋可以说是最棒的棋盘游戏之一,它是战略战术和纯技术的完美融合。每位玩家开局时各有16枚棋子:一王、一后、两车、两马、两象和八兵,各具不同功能与走法。真人对弈可以凭借玩家的经验,步步为营。那么,对于一个机器——计算机,你该如何教会它下棋?近日,有人在medium上发表了一篇文章,详细解释了如何教计算机玩国际象棋。
本文将从5个方面进行介绍:
Board表示;Board评估;移动选择;测试AI;接口测试。
在开始之前,你只需要提前安装Python3。
Board表示
首先,你需要对棋子背后的逻辑进行编码,即为每个棋子分配每一次可能的合法移动。
python-chess库为我们提供了棋子的移动生成和验证,简化了工作,安装方式如下:
!pipinstallpython-chess
python-chess库安装好后,导入chess模块并进行初始化:
importchessboard=chess.Board()board
在notebook中的输出如下所示:
board对象是一个完整的board表示,该对象为我们提供了一些重要的函数,例如,board.is_checkmate()函数检查是否存在将杀(checkmate),board.push()函数附加一个移动,board.pop()函数撤销最后一次移动等。阅读完整的文档请参阅:https://python-chess.readthedocs.io/en/latest/
Board评估
为了对board进行初步评估,必须考虑一位大师在各自比赛中的想法。
我们应该想到的一些要点是:
避免用一个小棋子换三个兵;象总是成对出现;避免用两个小棋子换一辆车和一个兵。
将上述要点以方程形式进行表达:
象>3个兵&马>3个兵;象>马;象+马>车+兵。
通过化简上述方程,可以得到:象>马>3个兵。同样,第三个方程可以改写成:象+马=车+1.5个兵,因为两个小棋子相当于一个车和两个兵。
使用piecesquaretable来评估棋子,在8x8的矩阵中设置值,例如在国际象棋中,在有利的位置设置较高的值,在不利的位置设置较低的值。
例如,白色国王越过中线的概率将小于20%,因此我们将在该矩阵中将数值设置为负值。
再举一个例子,假设皇后希望自己被放在中间位置,因为这样可以控制更多的位置,因此我们将在中心设置更高的值,其他棋子也一样,因为国际象棋都是为了保卫国王和控制中心。
理论就讲这些,现在我们来初始化piecesquaretable:
pawntable=[0,0,0,0,0,0,0,0,5,10,10,-20,-20,10,10,5,5,-5,-10,0,0,-10,-5,5,0,0,0,20,20,0,0,0,5,5,10,25,25,10,5,5,10,10,20,30,30,20,10,10,50,50,50,50,50,50,50,50,0,0,0,0,0,0,0,0]knightstable=[-50,-40,-30,-30,-30,-30,-40,-50,-40,-20,0,5,5,0,-20,-40,-30,5,10,15,15,10,5,-30,-30,0,15,20,20,15,0,-30,-30,5,15,20,20,15,5,-30,-30,0,10,15,15,10,0,-30,-40,-20,0,0,0,0,-20,-40,-50,-40,-30,-30,-30,-30,-40,-50]bishopstable=[-20,-10,-10,-10,-10,-10,-10,-20,-10,5,0,0,0,0,5,-10,-10,10,10,10,10,10,10,-10,-10,0,10,10,10,10,0,-10,-10,5,5,10,10,5,5,-10,-10,0,5,10,10,5,0,-10,-10,0,0,0,0,0,0,-10,-20,-10,-10,-10,-10,-10,-10,-20]rookstable=[0,0,0,5,5,0,0,0,-5,0,0,0,0,0,0,-5,-5,0,0,0,0,0,0,-5,-5,0,0,0,0,0,0,-5,-5,0,0,0,0,0,0,-5,-5,0,0,0,0,0,0,-5,5,10,10,10,10,10,10,5,0,0,0,0,0,0,0,0]queenstable=[-20,-10,-10,-5,-5,-10,-10,-20,-10,0,0,0,0,0,0,-10,-10,5,5,5,5,5,0,-10,0,0,5,5,5,5,0,-5,-5,0,5,5,5,5,0,-5,-10,0,5,5,5,5,0,-10,-10,0,0,0,0,0,0,-10,-20,-10,-10,-5,-5,-10,-10,-20]kingstable=[20,30,10,0,0,10,30,20,20,20,0,0,0,0,20,20,-10,-20,-20,-20,-20,-20,-20,-10,-20,-30,-30,-40,-40,-30,-30,-20,-30,-40,-40,-50,-50,-40,-40,-30,-30,-40,-40,-50,-50,-40,-40,-30,-30,-40,-40,-50,-50,-40,-40,-30,-30,-40,-40,-50,-50,-40,-40,-30]
通过以下四种方法得到评估函数:
第一步检查游戏是否还在继续。
这个阶段的背后编码逻辑是:如果它在checkmate时返回true,程序将会检查轮到哪方移动。如果当前轮到白方移动,返回值为-9999,即上次一定是黑方移动,黑色获胜;否则返回值为+9999,表示白色获胜。对于僵局或比赛材料不足,返回值为0以表示平局。
代码实现方式:
ifboard.is_checkmate():ifboard.turn:return-9999else:return9999ifboard.is_stalemate():return0ifboard.is_insufficient_material():return0
第二步,计算总的棋子数,并把棋子总数传递给material函数。
wp=len(board.pieces(chess.PAWN,chess.WHITE))bp=len(board.pieces(chess.PAWN,chess.BLACK))wn=len(board.pieces(chess.KNIGHT,chess.WHITE))bn=len(board.pieces(chess.KNIGHT,chess.BLACK))wb=len(board.pieces(chess.BISHOP,chess.WHITE))bb=len(board.pieces(chess.BISHOP,chess.BLACK))wr=len(board.pieces(chess.ROOK,chess.WHITE))br=len(board.pieces(chess.ROOK,chess.BLACK))wq=len(board.pieces(chess.QUEEN,chess.WHITE))bq=len(board.pieces(chess.QUEEN,chess.BLACK))
第三步,计算得分。material函数得分的计算方法是:用各种棋子的权重乘以该棋子黑白两方个数之差,然后求这些结果之和。而每种棋子的得分计算方法是:该棋子在该游戏实例中所处位置的piece-square值的总和。
material=100*(wp-bp)+320*(wn-bn)+330*(wb-bb)+500*(wr-br)+900*(wq-bq)pawnsq=sum([pawntable[i]foriinboard.pieces(chess.PAWN,chess.WHITE)])pawnsq=pawnsq+sum([-pawntable[chess.square_mirror(i)]foriinboard.pieces(chess.PAWN,chess.BLACK)])knightsq=sum([knightstable[i]foriinboard.pieces(chess.KNIGHT,chess.WHITE)])knightsq=knightsq+sum([-knightstable[chess.square_mirror(i)]foriinboard.pieces(chess.KNIGHT,chess.BLACK)])bishopsq=sum([bishopstable[i]foriinboard.pieces(chess.BISHOP,chess.WHITE)])bishopsq=bishopsq+sum([-bishopstable[chess.square_mirror(i)]foriinboard.pieces(chess.BISHOP,chess.BLACK)])rooksq=sum([rookstable[i]foriinboard.pieces(chess.ROOK,chess.WHITE)])rooksq=rooksq+sum([-rookstable[chess.square_mirror(i)]foriinboard.pieces(chess.ROOK,chess.BLACK)])queensq=sum([queenstable[i]foriinboard.pieces(chess.QUEEN,chess.WHITE)])queensq=queensq+sum([-queenstable[chess.square_mirror(i)]foriinboard.pieces(chess.QUEEN,chess.BLACK)])kingsq=sum([kingstable[i]foriinboard.pieces(chess.KING,chess.WHITE)])kingsq=kingsq+sum([-kingstable[chess.square_mirror(i)]foriinboard.pieces(chess.KING,chess.BLACK)])
第四步,计算评价函数,此时将会返回白棋的material得分和各棋子单独得分之和。
eval=material+pawnsq+knightsq+bishopsq+rooksq+queensq+kingsqifboard.turn:returnevalelse:return-eval
评价函数流程图
移动选择
算法的最后一步是用Minimax算法中的Negamax实现进行移动选择,Minimax算法是双人游戏(如跳棋等)中的常用算法。之后使用Alpha-Beta剪枝进行优化,这样可以减少执行的时间。
现在让我们深入研究一下minimax算法。该算法被广泛应用在棋类游戏中,用来找出失败的最大可能性中的最小值。该算法广泛应用于人工智能、决策论、博弈论、统计和哲学,力图在最坏的情况下将损失降到最低。简单来说,在游戏的每一步,假设玩家A试图最大化获胜几率,而在下一步中,玩家B试图最小化玩家A获胜的几率。
为了更好地理解minimax算法,请看下图:
维基百科中minimax树举例
为了得到更好的结果,使用minimax变体negamax,因为我们只需要一个最大化两位玩家效用的函数。不同点在于,一个玩家的损失等于另一个玩家的收获,反之亦然。
就游戏而言,给第一个玩家的位置值和给第二个玩家的位置值符号是相反的。
negamax示例
首先,我们将alpha设为负无穷大,beta设为正无穷大,这样两位玩家都能以尽可能差的分数开始比赛,代码如下:
except:bestMove=chess.Move.null()bestValue=-99999alpha=-100000beta=100000formoveinboard.legal_moves:board.push(move)boardValue=-alphabeta(-beta,-alpha,depth-1)ifboardValue>bestValue:bestValue=boardValuebestMove=moveif(boardValue>alpha):alpha=boardValueboard.pop()returnbestMove
下面让我们以流程图的方式来解释:
search函数的流程图
下一步是进行alpha-beta的剪枝来优化执行速度。
来自维基百科的alpha-beta剪枝说明
代码如下:
defalphabeta(alpha,beta,depthleft):bestscore=-9999if(depthleft==0):returnquiesce(alpha,beta)formoveinboard.legal_moves:board.push(move)score=-alphabeta(-beta,-alpha,depthleft-1)board.pop()if(score>=beta):returnscoreif(score>bestscore):bestscore=scoreif(score>alpha):alpha=scorereturnbestscore
现在,让我们用下面给出的流程图来调整alphabeta函数:
现在是静态搜索,这种搜索旨在仅评估静态位置,即不存在致胜战术移动的位置。该搜索需要避免由搜索算法的深度限制所引起的水平线效应(horizoneffect)。
代码如下:
defquiesce(alpha,beta):stand_pat=evaluate_board()if(stand_pat>=beta):returnbetaif(alpha< stand_pat): alpha = stand_patfor move in board.legal_moves: if board.is_capture(move): board.push(move) score = -quiesce(-beta, -alpha) board.pop()if (score >=beta):returnbetaif(score>alpha):alpha=scorereturnalpha
简单总结一下quiesce函数:
quiesce函数流程图。
测试AI
开始测试前,需要导入一些库:
测试有3项:
AI对弈人类;AI对弈AI;AI对弈Stockfish。
1.AI对弈人类:
AI选择从g1到f3,这是一个很明智的选择。
2.AI对弈AI:
3.AI对弈Stockfish:
可以得出:AI还不够智能,不足以打败stockfish12,但仍然坚持走了20步。
接口测试
上述测试方式看起来代码很多,你也可以写一个接口测试AI。
然后执行:
最终输出