526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
着陆器
强化学习:reward function shaping —— 着陆器(lander)游戏中的奖励函数的设计
lander 游戏是强化学习问题中常使用的一个游戏场景,不同人对该问题都设置了不同的reward function,一直也没有对该游戏的各种reward function的设计做一个记录,正好看视频看到了一个该游戏的reward function的设计,这里mark下。 资料来源: https:// ......
着陆器
函数
function
shaping
reward
更新时间 2023-06-27
共1篇 :1/1页
首页
上一页
1
下一页
尾页