书籍目录
首页
分类
免费
排行
我的书架
1-33章
共33章
免费
版权信息
免费
推荐序一
免费
推荐序二
免费
推荐序三
免费
推荐序四
免费
推荐序五
免费
前言
免费
1 绪论
免费
1.1 这是一本什么书
免费
1.2 强化学习可以解决什么问题
免费
1.3 强化学习如何解决问题
免费
1.4 强化学习算法分类及发展趋势
免费
1.5 强化学习仿真环境构建
免费
1.6 本书主要内容及安排
免费
第一篇 强化学习基础
免费
2 马尔科夫决策过程
免费
3 基于模型的动态规划方法
免费
第二篇 基于值函数的强化学习方法
4 基于蒙特卡罗的强化学习方法
5 基于时间差分的强化学习方法
6 基于值函数逼近的强化学习方法
第三篇 基于直接策略搜索的强化学习方法
7 基于策略梯度的强化学习方法
8 基于置信域策略优化的强化学习方法
9 基于确定性策略搜索的强化学习方法
10 基于引导策略搜索的强化学习方法
第四篇 强化学习研究及前沿
11 逆向强化学习
12 组合策略梯度和值函数方法
13 值迭代网络
14 基于模型的强化学习方法:PILCO及其扩展
后记
参考文献
×