推荐序1
我在中科大长期为本科生和研究生讲授人工智能相关课程,每次讲到人工智能的历史,就会提到人工智能之父——艾伦·图灵(Alan Turing),他也是英国著名的数学家和逻辑学家。二战时期,图灵曾协助军方破解了德国的著名密码系统“英格玛”(Enigma),从而扭转了战局,帮助盟军取得了二战的胜利。军事行动中破解密码的行为,其实就是在获取不对称的信息,从而占得先机,拔得头筹。
在和平年代,尽管没有烽火和狼烟,但商业环境中围绕信息的竞争却一点也不逊色于军事行动。掌握行业动态信息的基金公司可以把握股市的走向,从量化交易中获得利润;了解客户喜好的电子商务公司能够绘制用户画像,用精准推荐扩大流量;拥抱数据智能的政府机构可以打通数据孤岛,在海量数据指导下智慧治理。习近平总书记高屋建瓴总结性地指出“信息掌握的多寡成为国家软实力和竞争力的重要标志”“谁掌握了数据,谁就掌握了主动权”。
无论是量化交易程序,还是个性化精准推荐系统与智慧治理,都属于数据产品的范畴。数据除了在金融、电商、政府治理等领域有用武之地,其与实体经济也已深度融合,在各行各业都形成了增长点和新动能。然而利用好数据,做出适用于行业与特定领域的数据产品并非易事,这需要企业、机构员工都需具备一定的数据思维。
在我看来,正是由于海量的数据极大地扩展了人们的视野,传统的搜索才让位于个性化的精准推荐;正是由于数据快速的变化,人们才会目不暇接,甚至尚未从上一条数据所提供的信息中缓过神来,又要快速地投入到对下一条数据的处理。数据就这样从体量和速度上使得人们的认知有了盈余,从而我们可以在一个信息爆炸的时代站在历史的高度上和宏观的尺度上,更为深入地理解、思考、判断。
我们为整个互联网贡献了语音、图像、文本、视频以及地理位置数据,作为回馈,也享受了互联网基于这些数据而为我们提供的全方位、多角度、便捷的服务。无论是从移动互联网时代走过来的数字移民,还是生长在万物互联时代的数字原住民,都具有一幅全息、多维的数字用户画像。参与得越深刻,画像越清晰。毫不夸张地说,现实世界的物理空间与网络世界的虚拟空间的界限越来越模糊,数字化的自己已经逼近了真实的自己,数字化的事实也很有可能就是事实。多维数据的真实性越来越受到重视且不容置疑。
数据思维就像是现代化社会的一种方法论,它既是文化,也是工具;它既有阳春白雪的理论体系,也有下里巴人的实践指南。这一虚一实之间,顶天与立地之间,都润物细无声地透露着数据的价值。
本书作者曾在我的科大实验室中度过了7年的学生时光,学生时期他就善于深入浅出深奥知识,并分享给身边的人。这本书也延续了这个风格,原本需要高等数学基础的数据挖掘技术竟可以通过直白、简单的语言和比喻来说清楚,束之高阁的专业知识就这样走向大众,为更多的人服务。
书中详细介绍了大数据的来龙去脉,以及数据技能的方方面面。这既可以为企业中从事数据相关工作人员提供思维地图,也可以为其他机构中想要跨界了解数据世界的人提供一扇窗。另外,书中充满了关于数据历史、思维、技术周边的奇闻轶事,读起来想必不会枯燥,由此也可见作者广泛的阅读经历。
“纸上得来终觉浅,绝知此事要躬行”,要想发挥数据的价值,除了从思想上拥抱数据,更要掌握数据变换的规律,知晓数据挖掘的算法,运用数据产品的技巧,锻造数据人的自身修养,用数据指导实际工作。
希望《数据产品经理必修课:从零经验到令人惊艳》这本书能够带给你所需要的思维与技巧,也希望更多产业界的朋友能够做好合格的数据人,开发出优秀的数据产品,拥有惊艳的数据业绩!
陈恩红
中国科学技术大学教授
安徽省计算机学会理事长
安徽省大数据产业联盟理事长