上QQ阅读APP看书,第一时间看更新
第3章 数据准备
现在,你已经成功地准备好了一个系统平台用来掌握深度学习知识,参见第2章。我们将继续下去,给出一些在构建深度学习模型时可能经常遇到的、有关数据的重要指导原则。在学习深度学习知识的时候,拥有已经备好的完善数据集将帮助你更多地专注于对模型的设计,而不是准备数据。然而,每个人都知道这不是一个现实的期望,如果问任何数据科学家或机器学习专业人士这个问题,他们都会告诉你建模的一个重要方面是要知道如何准备数据。了解如何处理数据和如何准备数据将为你节省大量的工作时间,你可以把省下来的时间花在优化模型上。任何花在数据准备上的时间都是值得的。
本章将向你介绍数据处理背后的主要概念,并使得这些概念在深度学习中派上用场。内容将涵盖格式化分类、实值输出输入的基本概念,以及数据增强、降低数据维度的技术。在本章的最后,你应该能够处理最常见的数据操作技术,找到成功地选择深度学习方法的路径。
本章主要内容如下:
·二元数据与二元分类
·分类数据与多分类
·实值数据与单变量回归
·改变数据的分布
·数据增强
·数据降维
·操纵数据的道德影响