购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.5 习题

一、选择题

1.以下( )不属于kNN算法的优点。

A.算法思想简单,易于实现

B.无须参数估计

C.分类准确率高

D.不受k值影响

2.以下关于k近邻的说法中,不正确的是( )。

A.k近邻的训练时间较长

B.k近邻是一种投票法

C.k近邻算法分类结果会依赖于距离度量方法的选择

D.k近邻是一种无监督的学习方法

3.关于k近邻算法的描述,以下(  )说法是正确的。

A.k的取值越大,k近邻算法分类效果越好

B.k的取值越小,k近邻算法分类效果越好

C.k近邻算法分类效果与k的取值无关

D.k近邻算法分类结果依赖与k值的选择,k的选择需要根据分类结果进行调整再确定

4.在数据量非常大的时候,利用k近邻计算近邻距离是非常耗费时间的,为了提高搜索效率,就出现了KD树。KD树是一种对k维空间中样本点进行存储,以便对其进行快速检索的树形结构。关于KD树的说法,不正确的是( )。

A.当数据集维度d和k值都比较小时,kNN的时间复杂度和空间复杂度都为 O n ),而KD树可以将复杂度降低到 O (log 2 n

B.搜索KD树的过程就是根据目标样本点,首先找到包含目标样本点的叶结点,然后从该结点出发,依次回退到父结点,不断查找与目标点最近邻的结点,当确定不可能存在更近的结点时终止。搜索过程被限制在局部区域,从而提高搜索效率

C.最好情况下,KD树发现最近邻的时间复杂度为 O (log 2 n );最坏情况下,KD树发现最近邻的时间复杂度为 O n

D.当数据的维度增加时,KD树的时间复杂度并不会增加

5.以下说法中,不正确的是( )。

A.kNN只能用于分类任务,不能进行回归分析

B.kNN根据投票法进行分类

C.在对样本分类时,可利用直方图或Parzen正态窗可估计概率密度

D.当样本数量非常大时,kNN的时间复杂度非常高

二、算法分析题

利用sklearn库中的KneighborsClassifier对鲈鱼和三文鱼进行分类,并计算分类准确率。 k1JqAwOoZPudkKBgDjvhxQ5lS1Y6h7gf1C3oDx6Hl9S8ZmoMtx/CQQ8HjFFAeaO1

点击中间区域
呼出菜单
上一章
目录
下一章
×