1.4 习题
(1)试描述人工智能、机器学习、深度学习的含义,并说明它们之间的关系。
(2)列举在实际生活中有关机器学习的具体应用实例及相关的机器学习方法。
(3)阐述过拟合和欠拟合现象的产生原因及常用的解决办法。
(4)假设现对消费者的消费行为进行分析,要找出某类商品定价A和其销量B之间的关系,这属于机器学习中的何种任务?此类任务有何特点?
(5)简述方差和偏差的概念,并说明二者的区别和联系。
(6)对于样本集S={(2,1),(5,4),(3,3),(7,5),(8,9)},模型f(x)=4x+1,试求模型f(x)在S上的整体误差RS(f)。
(7)机器学习的发展历程有哪些阶段?试说明每个阶段机器学习方法的基本理论。
(8)如何训练一个感知机?该训练过程的理论依据是什么?
(9)简述专家系统的组成部分,并简要说明构造一个专家系统的过程。
(10)什么是特征空间?什么是特征向量?
(11)机器学习中为什么要进行特征提取?卷积神经网络的特征自动提取有何特点?
(12)结合具体实例来说明正确率、错误率和ROC曲线之间区别与联系。
(13)简要介绍模型性能度量中的真正例率、假正例率、查准率、查全率的概念,并讨论它们之间的区别与联系。
(14)要确定某基因X与某种疾病y之间是否存在联系,现对260人进行检查,得到体内是否含有该基因与是否患病之间的关系如表1-11所示,若χ2统计量的阈值设为7.2,X=0表示体内不含该基因,X=1表示体内含有该基因,y=-1表示不患病,y=+1表示患病。试根据表中数据确定该基因是否与该疾病存在某种联系。
(15)数据集D中包含100个样本,其中正例50个,反例50个,若使用自助法进行模型评估,则理论上训练集和测试集中各包含多少个样本?
表1-11 是否含有该基因与是否患病关系表
[1]感觉系统中刺激感受器阵列中某个区域时才能引起神经元活动模式改变的区域。