5.1 根据表5.1所给的训练数据集,利用信息增益比(C4.5算法)生成决策树。
5.2 已知如表5.2所示的训练数据,试用平方误差损失准则生成一个二叉回归树。
表5.2 训练数据表
5.3 证明CART剪枝算法中,当 α 确定时,存在唯一的最小子树 T α 使损失函数 C α ( T )最小。
5.4 证明CART剪枝算法中求出的子树序列{ T 0 , T 1 ,…, T n }分别是区间 α ∈[ α i , α i +1 )的最优子树 T α ,这里 i =0,1,…, n ,0= α 0 < α 1 <…< α n <+ ∞ 。