怎样编制黑白棋(4)

王朝other·作者佚名  2008-06-01
窄屏简体版  字體: |||超大  

开局及终局

开局

所有的强力程序都采用了开局定式,许多顶级程序的定式大多来自IOS游戏。对于强力的程序而言,他会在每一次对局结束以后升级定式,因此,对于有自学习功能的电脑来说,用上一次击败电脑的战术对付电脑是不会管用的。另一方面,具有自学习功能的电脑的中局棋力也会越来越强,原因是电脑会通过不断升级估值函数的权重来提高棋力。TD(Temporal Difference)就是一个实用的强化学习技术。一个应用了该技术的国际象棋程序在国际互联网上进行了300多局对局后,其等级分从1650分(一般水平)上涨到了2110分(美国大师水平)。

终局

终局是电脑的强项,它的搜索比中局快得多,主要有这样几个理由:

1.终局的估值函数很简单,他只用看双方谁胜了,估值就等于电脑的棋子减去对手的棋子。而不用判定行动力、潜在行动力、余裕手、边角判定和稳定子。

2.终局的搜索由于空格越来越少,使得搜索节点很少。如深度为5的搜索,中盘时叶子节点平均为10*10*10*10*10=100000,而终局时最大为5*4*3*2*1=120。

3.哈希表在终局时效率更高。

因为随着游戏向终局接近,玩者可下的位置逐渐减少,在终局阶段程序可以搜索得更深。这使得他们在终局比人类下得更好。看计算机在终局下棋经常感到不可思议,因为双方都在游戏结束20步以前知道了游戏的结果。对计算机而言,终局早在人类玩家中局结尾时就开始了,离游戏结束还有20-30步。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航