购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3.5 强化学习

强化学习 (reinforcement learning)不再强调规划方法中模型已知的这一假设。相反,智能体是在与环境交互的过程中学习相关的决策策略的。设计者只需提供性能指标,由学习算法负责优化智能体的行为。强化学习中出现的一个有趣的复杂性是,行为的选择不仅直接影响智能体在实现其目标方面是否成功,而且还影响智能体对环境的了解以及识别其可以利用的问题特征的能力。 mXBpzzu66SDkgSDdWup02CJJaKQayKFcF1UoO8zKpUOKGstR+oq+5ZL6z573fGwz

点击中间区域
呼出菜单
上一章
目录
下一章
×