当前位置:
王朝网络
>>
百科
>> 策略迭代法
策略迭代法
王朝百科·作者佚名 2010-03-17
窄屏简体版
字體:
小
|
中
|
大
|
超大
动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。
点击展开全文
上一篇:杀生丸
下一篇:宗叙
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
©
2005-
王朝網路
版權所有
導航