深入浅出Python机器学习
上QQ阅读APP看书,第一时间看更新

4.4.2 套索回归的参数调节

在上面的例子里,我们用了alpha的默认值1.0。为了降低欠拟合的程度,我们可以试着降低alpha的值。与此同时,我们还需要增加最大迭代次数(max_iter)的默认设置。让我们来看下面的代码:

运行代码,得到结果如图4-17所示。

图4-17 alpha等于0.1时的套索回归得分

【结果分析】从结果来看,降低alpha值可以拟合出更复杂的模型,从而在训练数据集和测试数据集都能获得良好的表现。相对岭回归,套索回归的表现还要稍好一点,而且它只用了10个特征中的7个,这一点也会使模型更容易被人理解。

但是,如果我们把alpha值设置得太低,就等于把正则化的效果去除了,那么模型就可能会像线性回归一样,出现过拟合的问题。比如我们把alpha值设为0.0001,试着运行下面的代码:

代码运行的结果如图4-18所示。

图4-18 alpha等于0.0001时套索回归的模型评分

【结果分析】从结果中我们看到,套索回归使用了全部的特征,而且在测试数据集中的得分稍微低于在alpha等于0.1时的得分,这说明降低alpha的数值会让模型倾向于出现过拟合的现象。