购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 机器学习的作用

机器学习主要解决三大问题:分类问题,如识别物体、评价事物、对事物进行分类;回归问题,如预测数值;聚类问题,如自动归类等。一些看似“高大上”的应用,本质上都属于上述三大问题之一。下面结合具体实例,讲解三大问题的含义。

1.分类问题

分类问题的回答通常是一个离散型的变量。例如,在物体检测中,需要回答有与没有;在评价事物时,将其分为三六九等;在检测人是否患病时,回答是与不是。分类问题区别于聚类问题,它是根据已知的分类来分类的。后者则不然,聚类时通过相似性自动将数据聚合成类。

2.回归问题

区别于输出离散型结果的分类问题,回归问题是指预测或估算数值型因变量的问题。例如,根据房屋的特征(面积、位置等)来预测其市场价格;根据历史销售数据和市场趋势预测未来的销售额;根据历史天气数据和当前气象条件来预测未来的气温、降水量等,我们称这种输出为数值型变量的问题为回归问题。

3.聚类问题

同样是划分类别,区别于分类问题,聚类问题在问题之初没有事先给定类别。聚类算法依靠计算机通过计算数据之间的相似性,自动将相近的数据划分为同一类。例如,我们在清理手机中的垃圾数据时,通常会推荐重复的照片、截图或者看起来非常相似的图片,让用户判断是否需要删除,这就是聚类的应用。聚类是在没有任何已知信息的前提下,计算机根据数据相似性自主学习,将物体聚为多类的任务。应该说,分类问题是一种监督学习(见1.3节),而聚类则属于无监督学习。 bl9gw201urdAWLmimC7tmXywWRRPbRTgkOu1JXO0bq9ZYXrcVeuoWIGU7TDBqwUS

点击中间区域
呼出菜单
上一章
目录
下一章
×