机器学习案例实战
上QQ阅读APP看书,第一时间看更新

第1章 常用机器学习平台

一个功能强大且易学、易用的机器学习平台对于开展机器学习项目非常重要。良好的机器学习框架提供了丰富的预制组件,可以方便机器学习模型的设计和实现。目前存在以下几类基本的机器学习平台:一类是开源的机器学习平台,API(Application Programming Interface,应用程序编程接口)丰富且不用付费,但学习成本高,例如R、Python、Mahout、Spark MLlib等。还有一类是商业化的机器学习平台,这类平台算法有限,但经过了长期的实践检验,系统问题比较少,学习成本低,很少编程甚至不用编程,但系统内的分析模型不够丰富,例如IBM SPSS Modeler。此外,还有一类机器学习平台综合了以上两类平台的优点,既提供了丰富的算法调用接口,可以通过图形化的人机接口快速搭建机器学习的工作流,又可以减少编程的工作量。目前微软、谷歌以及国内的BAT(百度、阿里巴巴、腾讯)等公司都提供了这样的机器学习平台。