书籍目录

首页
分类
免费
排行
我的书架

共33章

免费版权信息
免费推荐序一
免费推荐序二
免费推荐序三
免费推荐序四
免费推荐序五
免费前言
免费 1 绪论
免费 1.1 这是一本什么书
免费 1.2 强化学习可以解决什么问题
免费 1.3 强化学习如何解决问题
免费 1.4 强化学习算法分类及发展趋势
免费 1.5 强化学习仿真环境构建
免费 1.6 本书主要内容及安排
免费第一篇强化学习基础
免费 2 马尔科夫决策过程
免费 3 基于模型的动态规划方法
免费第二篇基于值函数的强化学习方法
4 基于蒙特卡罗的强化学习方法
5 基于时间差分的强化学习方法
6 基于值函数逼近的强化学习方法
第三篇基于直接策略搜索的强化学习方法
7 基于策略梯度的强化学习方法
8 基于置信域策略优化的强化学习方法
9 基于确定性策略搜索的强化学习方法
10 基于引导策略搜索的强化学习方法
第四篇强化学习研究及前沿
11 逆向强化学习
12 组合策略梯度和值函数方法
13 值迭代网络
14 基于模型的强化学习方法：PILCO及其扩展
后记
参考文献

×