在大数据和人工智能时代,许多重要的问题均涉及不确定状态下的决策,即智能决策。决策模型和决策算法是设计和构建自动决策系统以及决策支持系统的基石。不确定状态下的决策面临诸多挑战,如必须仔细平衡多个目标,同时还需要考虑不确定性因素的各种来源等。
本书涵盖与决策相关的各种主题,包括决策模型和计算方法所蕴含的相关理论。本书详细介绍了解决决策相关问题所涉及的基本数学公式和算法,广泛而深入地研究了不确定性状态下的决策算法。
本书主要分为以下五个部分:
● 第一部分讨论单步决策问题,即在单个时间点对简单决策中的不确定性和实现目标进行推理。
● 第二部分讨论序列决策问题,许多重要问题必须根据有关行为结果的信息做出一系列的决策。
● 第三部分讨论模型不确定性。模型并不是完全已知的,智能体必须通过学习以及与环境的交互来采取行动。通过观察状态转变和奖励形式的行为结果,智能体将选择能够最大化其长期奖励积累的行为。强化学习可以用于解决这类模型不确定性的问题。
● 第四部分讨论状态不确定性,不完善的感知信息会影响我们对完整环境状态的了解和掌握。
● 第五部分讨论多智能体系统,将其他智能体建模作为潜在的盟友或对手并随着时间的推移对决策算法进行相应的调整。
本书还提供了决策算法相关的各类图表以及大量的应用示例和练习题,以便向读者传达各种决策方法所隐含的直观思想。本书使用Julia程序设计语言实现相应的算法,读者可以免费使用本书中提供的所有代码片段,前提是明确指出代码的来源。
本书要求读者具有扎实的数学基础,附录中提供了相关的参考资料。本书主要面向高年级本科生、研究生以及专业人士,特别适用于数学、统计学、计算机科学、航空航天、电气工程和运筹学等学科领域。
本书源于斯坦福大学开设的一门名为“不确定性状态下的决策”的课程。作者Mykel J.Kochenderfer教授负责的斯坦福智能系统实验室主要研究和设计鲁棒决策系统的先进算法和分析方法,重点关注如何从高维、概率的问题中推导出最优的策略决策。
本书由华东师范大学的余青松、江红和余靖共同翻译。翻译也是一种再创造,同样需要艰辛的付出,感谢朋友、家人以及同事的理解和支持。在翻译过程中我们力求忠于原著,但由于时间和学识有限且本书涉及各个领域的专业知识,故书中的不足之处在所难免,敬请诸位同行、专家和读者指正。
余青松、江红、余靖
2023年7月