关闭→
当前位置:尚之范>生活>心理>自适应动态规划 - 什么是

自适应动态规划 - 什么是

尚之范 人气:9.62K
什么是 自适应动态规划

是人工智能学术语

自适应动态规划(Adaptive/Approximate Dynamic Programming,ADP),又叫近似动态规划,是人工智能和控制领域发展而交汇形成的新兴学科。

ADP方法主要包括三种基本类型:启发式动态规划(Heuristic Dynamic Programming,HDP),双启发式动态规划(Dual Heuristic Programming,DHP)和全局双启发式动态规划(Globalized Dual heuristic Programming,GDHP)。这三种类型都包含三个模块,如果每个模块都用神经网络来代替,这样我们也称这三个模块为三个网络,即评价网络(Critic Network)、模型网络(Model Network)和执行网络(Action Network)。如果我们省略了模型网络,使得执行网络直接与评价网络相连接,这样的结构称为它们的动作依赖(Action-Dependent)形式,即ADHDP,ADDHP,ADGDHP。

TAG标签:#规划 #