购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

不同的环境允许不同种类的动作。在给定的环境中,有效动作的集合经常被称为 动作空间(action space) 。像雅达利游戏和围棋(Go)这样的环境有 离散动作空间(discrete action space) ,在这样的动作空间里,智能体的动作数量是有限的。在其他环境,比如在物理世界中控制一个智能体,在这样的环境中就有 连续动作空间(continuous action space) 。在连续动作空间中,动作是实值的向量。

例如,走迷宫机器人如果只有往东、往南、往西、往北这 4 种移动方式,则其动作空间为离散动作空间;如果机器人可以向 中的任意角度进行移动,则其动作空间为连续动作空间。 wzzTEr52vCSWAWIDMR1KY8ubL5XPbv/tB4uhPtlOHZVv0EyhowrUTOyMGAmoMt8E

点击中间区域
呼出菜单
上一章
目录
下一章
×