推荐序二
现在人们常说选择比努力更加重要,说的就是在面对众多可能性时,保持清晰的思路,做出最有利于自己的决策并为之坚持不懈。这体现了决策在生活中的意义。决策可大可小,大到国家政策,小到生活琐事。但是无论决策大小,都需要决策者对所面临的问题以及内外部各种因素进行综合考量,这样才能够做出最佳决策。尤其是在当下这个大数据时代,各种数据和因素都会影响决策者的判断,这就需要决策者学会利用数据分析方法,从而不会迷失在数据海洋中。
在数据分析领域,决策树是一种非常流行的方法,此方法能够保证我们在面临各种干扰的时候做出理性的判断。近年来随着高性能计算、大数据和深度学习技术的飞速发展,决策树算法及其应用也得到了更为广泛的关注和更加快速的发展。尤其是决策树与深度学习相结合而发展起来的深度强化学习技术已取得若干突破性进展。
经典决策树算法诞生在20世纪90年代之前,它是一种非参数化的有监督学习方法,可用于分类和回归任务。与人工神经网络等算法不同,决策树相对来说更容易理解和解释,因为它共享内部决策逻辑。许多数据科学家认为这是一种老方法,而且存在过拟合问题,对其准确性也有一些怀疑。但最近的基于树的模型,特别是随机森林、梯度提升和XGBoost等建立在决策树算法之上的机器学习模型,已经获得了巨大的成功。我们相信,未来决策树算法将在数据分析领域拥有更广阔的应用前景。
因此,现在可以说是深入学习决策树算法的最佳时机,而本书则是入门和精通决策树算法的不二选择。书中系统地讲解了决策树算法的概念、基础知识和原理。从内容广度上来看,本书汇总了经典的决策树算法,不仅分析了各个决策树算法的核心原理,同时还进行了代码实现。从内容深度上来看,本书既介绍了传统的决策树算法(CART、ID3、C4.5等),也包括最近发展起来的深度决策树算法(并行决策树、蚁群决策树、深度决策树等)。通过阅读本书,读者能够快速、准确地了解决策树的全貌,并明晰未来决策树算法在数据分析领域的用途。
杨文胜
国家市场监督管理总局广州数据中心(灾备中心)主任
北京信城通数码科技有限公司CEO