购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

习题

(1)生成20个在 中的数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。不可分点集如图2.3所示。

图2.3 不可分点集

(2)生成100个数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。

(3)生成1000个数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。

(4)生成1000个在 中的数据,然后运行迭代算法,观察收敛情况。

(5)修改迭代过程

重新完成上面的问题。

(6)在平面 上列出200个点(或者若干点),其中100个点聚在一个区域,另外100个点聚在另一个区域,但在中间互有相交。使用线性规划的方法找出一个分类的超平面。

(7)线性规划中对于分类问题的优化函数的设定是否有问题?是否可以重新改变优化函数,使得分类更加有意义?

(8)计算分类的错误度或者损失函数。给出点集( x 1 ,y 1 ),( x 2 ,y 2 ),···,( x n ,y n ),其中, ,y i ∈{-1,1}。定义

那么错误度或者损失函数就是| A |/ n 。如果优化的目标是使这个错误度最小,试利用Python的优化包重新设计算法,寻找 ,使得上述损失达到最小,并观察这种方法的优缺点。

(9)利用命令

     from sklearn import datasets
     from sklearn.datasets import load_breast_cancer
     sklearn.datasets.load_breast_cancer
     data = load_breast_cancer()

调取数据,同时对数据进行分类,完成Breast Cancer的诊断。

(10)使用给出的Default of Credit Card数据来进行分析,试做出分类。 qcOYnD3oHiVgIsk56xsDaAr7xEbIBtwFEUMOEBb4/A/jRxhGBlk8jN2v/opQ/ZuK

点击中间区域
呼出菜单
上一章
目录
下一章
×