机器学习实战:基于Scikit-Learn、Keras和TensorFlow(原书第3版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.7 练习题

在本章中,我们介绍了机器学习中一些最重要的概念。在接下来的几章中,我们将更深入地研究并编写更多代码,但在此之前,请确保你可以回答以下问题:

1.如何定义机器学习?

2.机器学习在哪些问题上表现突出,你能说出四类应用吗?

3.什么是被标记的训练集?

4.最常见的两种监督学习任务是什么?

5.你能说出四种常见的无监督学习任务吗?

6.你会使用什么类型的算法让机器人在各种未知地形中行走?

7.你会使用什么类型的算法将客户分成多个组?

8.你会把垃圾邮件检测问题定义为监督学习问题还是无监督学习问题?

9.什么是在线学习系统?

10.什么是核外学习?

11.什么类型的算法依赖于相似性度量来进行预测?

12.模型参数和模型超参数有什么区别?

13.基于模型的算法搜索什么?它们最常用的成功策略是什么?它们如何做出预测?

14.你能说出机器学习中的四个主要挑战吗?

15.如果你的模型在训练数据上表现很好,但对新实例的泛化能力很差,这是怎么回事?你能说出三种可能的解决方案吗?

16.什么是测试集?为什么要使用它?

17.验证集的目的是什么?

18.什么是train-dev集?什么时候需要它?如何使用?

19.如果使用测试集来调整超参数会出现什么问题?

这些练习题的答案可在本章notebook的末尾找到,网址为https://homl.info/colab3


[1] 有趣的事实:这个听起来很奇怪的名字是Francis Galton在研究高个子的孩子往往比父母矮的事实时引入的一个统计术语。由于孩子比父母要矮一些,他称这种现象为回归到均值。这个术语后来被他应用于分析变量之间相关性的方法上。

[2] 注意,动物与车辆可能离得很远,马与鹿的距离近但和鸟的距离远。图的使用得到了Richard Socher等人许可,“Zero-Shot Learning Through Cross-Modal Transfer”,Proceedings of the 26th International Conference on Neural Information Processing Systems 1(2013):935-943。

[3] 这就是系统运行良好的情况。在实践中,它通常会为每个人创建几个集群,有时会将两个看起来相似的人混合在一起,因此你可能需要为每个人提供一些标签并手动清理一些集群。

[4] 按照惯例,希腊字母θ(theta)通常用于表示模型参数。

[5] 如果你还没有看懂所有的代码也没关系,我将在以下各章中介绍Scikit-Learn。

[6] 例如,根据上下文知道应该写“to”“two”还是“too”。

[7] 图经Michele Banko和Eric Brill许可转载,“Scaling to Very Very Large Corpora for Natural Language Disambiguation”,Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics (2001):26-33。

[8] Peter Norvig et al.,“The Unreasonable Effectiveness of Data”,IEEE Intelligent Systems 24,no. 2 (2009):8-12.

[9] David Wolpert,“The Lack of A Priori Distinctions Between Learning Algorithms”,Neural Computation 8,no. 7 (1996):1341-1390.