购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3.2 监督式学习

在处理某些问题时,相比于编写程序让智能体去遵循,采用“直接向智能体展示应该做什么”的方法可能会更容易。设计者提供了一组训练示例,自动学习算法必须通过这些示例进行泛化。这种方法被称为 监督式学习 (supervised learning),并已广泛应用于分类问题。当这种技术被应用于学习从观测到操作行动的映射时,有时被称为 行为克隆 (behavioral cloning)。当一位专家级设计师知道一系列典型情况的最佳行动方案时,行为克隆就可以很好地完成任务。尽管已经存在多种不同的学习算法,但在新的情况下,这些学习算法的表现通常不会超越人类设计师。 o/NMGeyXvII9kZea7cI5TRpoTgtdKsUuhuSvU6Uy61frG5MjDGP/6Rt+rTSmh1wc

点击中间区域
呼出菜单
上一章
目录
下一章
×