决策算法最新章节_米凯尔·J.科申德弗著

1.3.2 监督式学习

在处理某些问题时，相比于编写程序让智能体去遵循，采用“直接向智能体展示应该做什么”的方法可能会更容易。设计者提供了一组训练示例，自动学习算法必须通过这些示例进行泛化。这种方法被称为监督式学习（supervised learning），并已广泛应用于分类问题。当这种技术被应用于学习从观测到操作行动的映射时，有时被称为行为克隆（behavioral cloning）。当一位专家级设计师知道一系列典型情况的最佳行动方案时，行为克隆就可以很好地完成任务。尽管已经存在多种不同的学习算法，但在新的情况下，这些学习算法的表现通常不会超越人类设计师。

购买书籍时，会优先扣除您的代金券，再扣除阅饼；当您的余额不足时，可使用微信或支付宝支付，补足差价；
连载书籍勾选自动购买下一章后，会自动扣费，已购章节不会重复扣费；
书籍购买记录请至我的—购书记录中查询