白话机器学习算法
上QQ阅读APP看书,第一时间看更新

第1章 基础知识

要想完全搞明白数据科学算法,必须先从基础知识学起。本章主要介绍数据科学的基础知识,它是本书最长的一章,篇幅大概是后续各章(讲解各种具体算法)的两倍。通过学习本章,你将对绝大多数数据科学研究涉及的基本步骤有大致的了解。这些基本步骤会帮助你评估上下文以及约束条件,并选出适合在研究中使用的算法。

数据科学研究有4个主要步骤。首先,必须处理和准备待分析的数据。其次,根据研究需求挑选合适的算法。再次,对算法的参数进行调优,以便优化结果。最后,创建模型,并比较各个模型,从中选出最好的一个。