人工智能辅助药物设计
上QQ阅读APP看书,第一时间看更新

2.2 机器学习的分类

对于初学者来说,弄清楚机器学习的分类情况有助于后续的学习,能够更好地理解机器学习理论。机器学习最常见的分类方式为按任务类型分类按学习方式分类

2.2.1 按任务类型分类

按任务类型分类,机器学习可以分为回归问题、分类问题、聚类问题和降维问题等。

1.回归问题

回归问题是指标签为连续值的机器学习问题。例如,预测一只股票的价格、下雨的时间和明天的室外气温等问题,这些问题的标签都是连续值。常见的回归算法有线性回归、逻辑回归和岭回归等。

回归示例:根据房子的面积、楼层、卧室个数、学区与否预测房价。如表2-1所示,通过前6套房子的信息预测最后两套房子的房价。

表2-1 房价预测信息表

2.分类问题

分类问题是指标签为有限个离散值的机器学习问题。例如,预测明天是否下雨、足球比赛哪一队会胜和一张图片是猫还是狗等问题,这些问题的标签都存在有限个离散值。常见的分类算法有kNN、决策树、随机森林、支持向量机、逻辑回归等。

举个例子,小时候,家长会教我们识物,告诉我们某个动物是猫、是狗或是猪,然后在我们的大脑里就会形成或猫或狗或猪的印象(相当于模型构建),面前来了一条“新”小狗,如果你能叫出来“这是一只小狗”,那么恭喜你,标签分类成功!但如果你回答说“这是一头小猪”。这时家长就会纠正你的偏差,“乖,不对,这是一只小狗”,这样一来二去地进行训练,不断更新你大脑的认知体系,下次再遇到这类新的“猫、狗、猪”等,你就能给出正确的“预测”分类。分类问题和回归问题都属于监督学习。

3.聚类问题

聚类问题是将数据集划分成若干个不相交的子集或族,每个子集内的元素尽量相似的问题。简单来说,就是希望利用模型将数据集划分成几类。其主要的思路是“物以类聚,人以群分”,算是分类问题的一种特殊情况。例如,市场的划分、社群分析和消费人群的习惯分析等。常见的聚类算法有K均值、DBSCAN算法和EM算法等。

小时候我们在认识狗时,可能不清楚狗代表什么意思,但是因为狗的相似性,我们能够将其归为一类,并且可以将没见过的狗的图片归为狗这一类,这样的思路就是聚类。

4.降维问题

降维问题是指采用某种映射方法将高维空间的数据映射到低维空间。数据降维的目的:直观地看,维度降低了,便于计算和可视化,其更深层次的意义在于有效信息的提取、综合及无用信息的摈弃。

常见的降维算法有主成分分析(PCA)、线性判别分析(LDA)、LE和LLE等。

2.2.2 按学习方式分类

1.监督学习

监督学习(supervised learning)的输入是由输入特征和标签组成的数据。例如,训练集有10 000条数据,但是只有1000条数据是带标签(已标记好)的,这时我们可以用监督学习,先输入1000条标记好的数据,让机器学习模型去学习,然后利用学习到的信息对剩余的9000条数据进行分类。换个说法,监督学习就是让模型根据训练集中的题目(特征)和答案(标签)去学习,对测试集中的题目,预测出最有可能的答案。

监督学习根据标签的情况可以分为回归和分类。

事实上,整个机器学习就是在干一件事,即通过训练、学习得到某个模型,然后期望这个模型也能很好地适用于“新样本”(即预测)。这种模型适用于新样本的能力,也称为“泛化能力”,是机器学习算法非常重要的特点。

2.无监督学习

与监督学习相反,无监督学习(unsupervised learning)的输入是只有特征值没有标签的数据,主要适用于聚类问题和降维问题。

3.半监督学习

在半监督学习(semi-supervised learning)中,训练集同时包含带标签的样本数据和不带标签的样本数据,也就是说,训练过程中,既会用到标签数据,也会用到不带标签的数据。半监督学习包含大量未标注数据和少量标注数据,主要是利用未标注数据中的信息,辅助标注数据进行监督学习。

4.强化学习

强化学习是将学习看作由一连串动作组成的集合,学习过程的每一个动作。在此期间,我们不会简单、生硬地告诉机器它所做出的动作是对的还是错的。这就好比训练宠物,我们会告诉小狗去拿一个苹果,如果小狗拿回来一串香蕉,而香蕉恰好是我最爱吃的水果,那么我不能说小狗的这个学习动作在t时间段内是错误的,而只能说在t时间段内,小狗的这个学习动作是好的,并给予它奖励。小狗得到奖励后,可能在下次我们想要苹果时,继续拿回香蕉,我们就会因为它做出错误的“反馈”而“批评”——在t+1时间段内,取回香蕉这样的动作是“不好”的。由此可见,不同于前3类的学习,强化学习的标签不是固定的,而需要根据当时的情况(也可以加上历史情况)给出一个好坏的奖惩结果。