1-1 强化学习的基本结构是什么?
1-2 强化学习相对于监督学习为什么训练过程会更加困难?
1-3 强化学习的基本特征有哪些?
1-4 近几年强化学习发展迅速的原因有哪些?
1-5 状态和观测有什么关系?
1-6 一个强化学习智能体由什么组成?
1-7 根据强化学习智能体的不同,我们可以将其分为哪几类?
1-8 基于策略和基于价值的强化学习方法有什么区别?
1-9 有模型强化学习和免模型强化学习有什么区别?
1-10 如何通俗理解强化学习? uue1lkPZszlLvG797+QwTlxtkgd+r8vfoSfCVBHWAM0d1pnPffNHHtUMlsZ7OenJ