前言
为什么要写这本书
在我做数据分析培训和咨询的过程中,经常会有学员来问我,有没有合适的统计分析方面的参考书可以推荐。被学员问得多了,慢慢地就有了写本书的冲动,一是毕竟自己写的书和培训的内容比较配套,二是写书对自己来说也是一个总结和提高的过程吧。
“理想很丰满,现实很骨感”,原来觉得自己手里有不少案例,各种工具的使用也算是比较熟练,写起书来应该得心应手,进度也会比较快,但是真到开始动手写作时,才发现并不是那么简单。从框架目录的确定、章节内容的选择、语言风格的打磨,到分析结果截图的选择等,每一个环节都需要细细地思量和斟酌。这本书的写作使我从2016年4月到11月的这段时间非常疲劳,颈椎病也复发了,因为在写书的同时,我的数据分析方面的培训并没有停止。
我在写作本书的时候,给自己规定了几个原则:
一是要实用,要能够解决企业工作中的实际问题。
二是要尽可能地降低读者上手的难度,那种操作非常繁复、需要强大坚实的统计分析理论基础,或者需要编程才能实现的功能,我都没有放在本书中。原因很简单,即使本书讲了那些难度比较大的内容,读者也很难真正应用起来。
三是语言风格尽可能轻松活泼一点,尽量避免很严肃、很晦涩的专业术语,我很难做到“寓教于乐”,但还是尽己所能让本书的阅读轻松一点吧。
在本书的写作过程中,我经常提醒自己这三条原则,并且要求自己遵守它们。
简言之,给读者带来一本“有用的、上手比较容易的、读起来比较轻松的”数据分析书,这就是我写这本书的原则和动力。
读者对象
这本书的读者对象是企事业单位中从事数据分析的非统计专业人士:
❑ 企业中的市场部相关人员,包括市场分析人员、产品设计和研发人员、销售经理等。
❑ 企业中的生产部人员,包括生产经理、质量控制经理等。
❑ 企业中的财务部人员,包括财务总监、财务经理等。
❑ 企业中其他需要经常和各类数据打交道的管理人员和一般工作人员。
如果读者是高校或者科研院所的教师、学生、科研人员,要从事专业学术论文的撰写或者纵向科研项目的研究工作,不建议你将本书作为主要的阅读和学习的书籍,因为使用的工具、模型、方法都会大相径庭,例如撰写学术论文经常要使用Eviews、Stata等专业计量工具,而这些专业计量工具在企业中使用的概率非常低。
如何阅读本书
本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。
第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。
第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。
正文中所提“案例文件”为本书的配置案例资料,请通过网络自行下载,下载地址为http://www.hzbook.com。
勘误和支持
由于作者的水平有限,编写的时间也很仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果你发现本书有错误,或者有其他宝贵意见,请发送邮件到我的邮箱jhyjhy8888@163.com,我很期待能够收到你们的真挚反馈。
致谢
我跟我的家人说,我这本书是以“part time”的方式写出来的,因为在写书的过程中,我还在四处上课,也做了一些小的咨询项目。
多年以后,如果回顾2016年,我给哪些企业上过哪些课,我未必能记清楚,但是2016年我写作了平生第一本书,这点我不会忘记。
感谢机械工业出版社华章公司的编辑杨绣国老师,感谢你的魄力和远见,在这一年多的时间中始终支持我的写作,你的鼓励和帮助引导我顺利完成了全部书稿。
最后我一定要感谢我的家人,是你们给了我一个温暖的港湾,让我在这一年中几乎不用做家务,专心从事培训和本书的写作,多谢多谢!
谨以此书,献给我最亲爱的家人,以及众多热爱数据分析的朋友。
纪贺元
2017年1月于中国上海