购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.7 习题

1.有一个梅花鹿的数据样本,如表2.10所示。

表2.10 梅花鹿数据样本

请指出特征、特征向量、个体和样本容量,并思考“序号”是否属于一个特征,为什么?

2.在2.1.3节中,测试集的 R 方为负数,这意味着什么?

3.是否所有模型的训练都需要风险函数?请举例说明。

4.调整 R 方有什么作用?为什么调整 R 方总小于 R 方?

5.请简要说明最大似然法的基本原理。

6.请简要说明最大后验法的基本原理,并说明最小描述法如何表示最大后验法的。

7.请简述什么是过拟合,导致过拟合的原因有哪些?

8.请根据机器学习的完整流程,重新解决2.5.1节中的例题。

9.在2.5.3节中忽略了数据集的划分。请结合机器学习的完整流程和分类问题的评价指标,重做2.5.3节中的例题。

*10.在2.5.3节中,细心的读者可能会发现, k 的选取会影响预测结果,请思考如何选取 k 值,尝试提出自己的做法。

11.测得一组弹簧的形变 x 与相应的外力 y 数据如表2.11所示。

表2.11 弹簧与应力数据表

选择合适的机器学习模型,训练并预测 x =8时,外力的大小(请务必划分数据集)。

12.为了验证某射线的杀菌作用,用固定强度的某射线照射杀菌,设照射时间为 x ,照射后剩余的细菌数为 y ,实验数据如表2.12所示。

表2.12 照射时间与剩余细菌数

请用MATLAB cftool进行非线性回归分析并评价该模型(划分数据集),同时估算细菌的初始数量。

13.有数据如表2.13所示,请利用KNN算法,判断特征为(61,46,61)个体的所属类别。

表2.13 样本特性与所属类别 iVpuS6wrlLv7sIxwD0YT5M6ZPs90yimiOI/4DaKZ38jBE54LUICrjnP3cHi64p0j

点击中间区域
呼出菜单
上一章
目录
下一章
×