书籍目录
首页
分类
免费
排行
我的书架
1-50章
共50章
免费
版权信息
免费
内容提要
免费
前言
免费
资源与支持
免费
第1章 起源:扩散模型简介
免费
1.1 生成模型的发展史
免费
1.2 扩散模型核心思想介绍
1.3 条件扩散模型
1.4 扩散模型加速采样方法
参考文献
第2章 基石:扩散模型与轨迹优化问题
2.1 离线强化学习
2.2 第一个基于扩散模型的决策智能体:Plan Diffuser
2.3 条件生成决策模型的集大成者:Decision Diffuser
2.4 代码实战
参考文献
第3章 基石:扩散模型与价值函数的结合
3.1 强化学习中基于价值函数的策略优化
3.2 Diffusion-QL:高效建模离线数据集中的行为策略
3.3 CEP和QGPO:借助能量函数设计新的引导器
3.4 LDCQ:扩散模型约束下的Q-learning
参考文献
第4章 基石:扩散模型训练技巧指南
4.1 如何设计去噪网络
4.2 如何设计训练方案
4.3 如何选择扩散模型的类型
4.4 代码实战
参考文献
第5章 扩展:多任务泛化
5.1 离线元强化学习
5.2 MetaDiffuser
参考文献
第6章 扩展:世界模型建模
6.1 世界模型简介
6.2 基于RNN的世界模型
6.3 基于Transformer的世界模型
6.4 基于扩散模型的世界模型
参考文献
第7章 反转:用强化学习来优化扩散模型
7.1 引言
7.2 DDPO:将去噪过程建模为序列决策过程
7.3 Diffusion-DPO:运用于扩散模型的直接偏好优化
7.4 DRaFT:通过可微分奖励函数直接优化扩散模型
7.5 代码实战
参考文献
第8章 扩展:扩散模型在决策问题上的新进展
8.1 基于生成模型的强化学习策略
8.2 决策基模型中的扩散模型
8.3 总结与展望
参考文献
×