(1)生成20个在 中的数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。不可分点集如图2.3所示。
图2.3 不可分点集
(2)生成100个数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。
(3)生成1000个数据,并显示这些数据,同时显示最初的分割线,然后运行迭代算法,观察收敛情况。
(4)生成1000个在 中的数据,然后运行迭代算法,观察收敛情况。
(5)修改迭代过程
重新完成上面的问题。
(6)在平面 上列出200个点(或者若干点),其中100个点聚在一个区域,另外100个点聚在另一个区域,但在中间互有相交。使用线性规划的方法找出一个分类的超平面。
(7)线性规划中对于分类问题的优化函数的设定是否有问题?是否可以重新改变优化函数,使得分类更加有意义?
(8)计算分类的错误度或者损失函数。给出点集( x 1 ,y 1 ),( x 2 ,y 2 ),···,( x n ,y n ),其中, ,y i ∈{-1,1}。定义
那么错误度或者损失函数就是| A |/ n 。如果优化的目标是使这个错误度最小,试利用Python的优化包重新设计算法,寻找 ,使得上述损失达到最小,并观察这种方法的优缺点。
(9)利用命令
from sklearn import datasets from sklearn.datasets import load_breast_cancer sklearn.datasets.load_breast_cancer data = load_breast_cancer()
调取数据,同时对数据进行分类,完成Breast Cancer的诊断。
(10)使用给出的Default of Credit Card数据来进行分析,试做出分类。