上QQ阅读APP看书,第一时间看更新
1.5 机器学习中的分类与回归
分类和回归是有监督学习中两个最常见的方法。对于分类来说,机器学习的目标是对样本的类标签进行预测,判断样本属于哪一个分类,结果是离散的数值。而对于回归分析来说,其目标是要预测一个连续的数值或者是范围。
这样讲可能会有一点抽象,我们还是用小C的例子来理解一下这两个概念。
比如,小C在使用算法模型预测女神的电影喜好时,他可以将电影分为“女神喜欢的”和“女神不喜欢的”两种类型,这就是二元分类,如果他要把电影分为“女神特别喜欢的”“女神有点喜欢的”“女神不怎么喜欢的”以及“女神讨厌的”四种类型,那么这就属于多元分类。
但如果小C要使用算法模型预测女神对某部电影的评分,例如,女神会给“速度与激情8”打多少分,从0到100,分数越高说明女神越喜欢,最终模型预测女神会给这部电影打88分,这个过程就称为回归。小C需要将女神给其他电影的评分和相对应的电影特征作为训练数据集,通过建立回归模型,来给“速度与激情8”打分。