怎样编制黑白棋(4) - 王朝网络宽屏版

开局及终局

开局

所有的强力程序都采用了开局定式，许多顶级程序的定式大多来自IOS游戏。对于强力的程序而言，他会在每一次对局结束以后升级定式，因此，对于有自学习功能的电脑来说，用上一次击败电脑的战术对付电脑是不会管用的。另一方面，具有自学习功能的电脑的中局棋力也会越来越强，原因是电脑会通过不断升级估值函数的权重来提高棋力。TD(Temporal Difference)就是一个实用的强化学习技术。一个应用了该技术的国际象棋程序在国际互联网上进行了300多局对局后，其等级分从1650分（一般水平）上涨到了2110分（美国大师水平）。

终局

终局是电脑的强项，它的搜索比中局快得多，主要有这样几个理由：

1.终局的估值函数很简单，他只用看双方谁胜了，估值就等于电脑的棋子减去对手的棋子。而不用判定行动力、潜在行动力、余裕手、边角判定和稳定子。

2.终局的搜索由于空格越来越少，使得搜索节点很少。如深度为5的搜索，中盘时叶子节点平均为10*10*10*10*10=100000，而终局时最大为5*4*3*2*1=120。

3.哈希表在终局时效率更高。

因为随着游戏向终局接近，玩者可下的位置逐渐减少，在终局阶段程序可以搜索得更深。这使得他们在终局比人类下得更好。看计算机在终局下棋经常感到不可思议，因为双方都在游戏结束20步以前知道了游戏的结果。对计算机而言，终局早在人类玩家中局结尾时就开始了，离游戏结束还有20-30步。