我们可以使用许多不同的方法来设计决策智能体。根据不同的应用场景,每种方法都有其更适用的场合。这些方法针对不同的设计者提出不同的要求,并且针对不同的自动化系统所实现的任务也有所不同。本节将简要概述这一系列的方法。本书将主要关注规划和强化学习,其中一些技术将涉及监督学习和优化。 vxFiGEdUPRHkZaoh0sJ5EBzhbAepx6LfIXh2p08aDYaynTUIJTdFah5JYcUkAB+Q