1.1 什么是机器学习——从一个小故事开始
要搞清楚什么是机器学习,我们可以从一个小故事开始。
小C是一个即将毕业的大学生、单身的小伙子,他一直在暗地里喜欢隔壁班的女神,可是又苦于没有机会接近她,于是在很长一段时间里,小C只能保持这种暗恋的状态。
突然有一天,在一个很偶然的机会下,小C得到了女神的微信号,并且添加了她。然后开始密切关注她的朋友圈,观察她的一举一动。
不久小C就有了重大发现,女神在朋友圈经常发三种类型的内容:书籍、电影和旅游。这可是个了不起的发现,对于小C来说,千载难逢的机会来了。
接下来,小C把女神喜欢的书名和特征(Features)保存在电脑上,做成一个数据集(Dataset),然后根据这个数据集用“算法(Algorithm)”建立了一个“模型(Model)”,并且通过这个模型预测出了女神会喜欢哪一本新书,之后小C买下了模型预测出来的书,作为礼物送给了女神。
收到新书的女神很开心,也对小C产生了好感。
后来小C又用同样的方法预测出了女神喜欢的电影,并买票请女神去看。不出所料,每次女神的观影体验都棒极了,两个人的关系也越来越近。
再后来,小C又预测了女神会喜欢的旅游地点,订好机票和酒店,对女神发出了邀请。当然,女神不会拒绝小C了,因为这次旅游的目的地可是她一直想去的地方呢!
整个旅途愉快极了,小C总能像手术刀一样精准地切到女神最感兴趣的话题上。女神觉得太不可思议了,她问小C:“为什么你会这么了解我呢?”小C按捺住内心的喜悦,故作镇定地说道:“这是机器学习的力量。”
“什么是机器学习啊?”女神不解。
是时候让小C展现出扎实的学术底蕴了,他抬头45°仰望星空,深沉地说道:
“机器学习,最早是由一位人工智能领域的先驱,Arthur Samuel(见图1-1),在1959年提出来的。本意指的是一种让计算机在不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,属于计算机科学领域的一个子集。公认的世界上第一个自我学习项目,就是Samuel跳棋游戏。而我也是通过机器学习的方法,通过你在社交媒体的数据预测出你的喜好的。”
图1-1 Arthur Samuel和他的跳棋游戏
毫无悬念地,女神对小C产生了深深的崇拜感,并且芳心暗许。从此以后,两个人走在了一起,并过上了幸福的生活。
对于一部童话来说,故事到这里就可以结束了。可是对于一本机器学习的入门书来说,我们才刚刚开始。
有了女朋友的小C也要背负起自己的责任了,他需要一份工作,才能为两个人的生活提供经济来源。很幸运的是,他通过校园招聘进入了国内最大的互联网公司——蝙蝠公司,成为一名机器学习工程师,从此开始了他的职业生涯。