1.2 机器学习的一些应用场景——蝙蝠公司的业务单元
小C入职的蝙蝠公司,作为国内互联网行业的龙头企业,其业务覆盖面十分广泛,包括电子商务、社交网络、互联网金融以及新闻资讯等。每一个方向在内部都被称为一个BU(业务单元)。每个BU相对独立运作,有自己完善的体系。但机器学习技术,在每个BU都有非常深入的应用。下面我们来大致了解一下。
1.电子商务中的智能推荐
蝙蝠公司的电子商务BU是国内最大的在线零售平台,其用户接近5亿,每天在线商品数超过8亿,平均每分钟会售出4.8万件商品。正因此,电子商务BU拥有海量的用户和商品数据。当然,为了让平台的成交总额(Gross merchandise Volume, GMV)不断提高,电子商务BU必须精确地为用户提供商品优惠信息。和小C预测女神的喜好类似,电子商务BU要通过机器学习,来对用户的行为进行预测。但在如此海量的数据下,模型要比小C的模型复杂很多。
比如某个男性用户的浏览记录和购买记录中有大量的数码产品,而且系统识别出该用户访问平台时使用的设备是iPhone 7,则算法很有可能会给该用户推荐iPhone X的购买链接。而另外一个女性用户浏览和购买最多的是化妆品和奢侈品,那么机器就会把最新款的Hermès或者Chanel产品推荐给她。
2.社交网络中的效果广告
蝙蝠公司旗下的社交网络平台目前有超过9亿的月活跃用户(Monthly Active Users, MAU),其主要盈利模式是通过在社交网络中投放效果广告,从而为商家提供精准营销的服务。在这种盈利模式下,该BU需要保证广告的投放尽可能精准地到达目标受众,并转化为销售。因此需要机器学习算法来预测用户可能感兴趣的广告内容,并且将符合要求的内容展示给用户。
比如用户经常转发或点赞和汽车有关的信息,那么系统就会把某品牌新车上市的广告展示给用户,而如果用户经常转发或点赞的是和时尚相关的信息,那么系统推荐的广告就会是新一季的服装搭配潮流等。
3.互联网金融中的风控系统
蝙蝠公司旗下另外一个业务单元——互联网金融事业部,主要是为用户提供小额贷款和投资理财服务。目前该BU拥有4.5亿用户,具有每秒处理近9万笔支付的能力。而且它的资产损失比率仅有0.001%,这是一个非常恐怖的数字!要知道全球最老牌的在线支付工具资产损失比率也要0.2%。要达到如此低的资产损失比率,必须要有强大的风控系统作为支撑,而风控系统背后,就是机器学习算法的应用。
例如,在这个场景中,风控系统要能够收集已知的用户欺诈行为,并对欺诈者的行为数据进行分析,再建立模型,在类似的欺诈行为再度发生之前就把它们扼杀在摇篮里,从而降低平台的资产损失比率。
4.新闻资讯中的内容审查
蝙蝠公司旗下的新闻资讯业务单元的表现也同样让人眼前一亮。这个BU的产品主要是新闻客户端APP,据称其激活用户数已经超过6亿,而平均每个用户使用时长达到了76分钟。而令人咂舌的是,这个业务单元下据说没有编辑人员,所有的内容处理都是通过机器学习算法自动完成的。
比如该产品的“精准辟谣”功能,就是主要依赖机器学习的算法,对内容进行识别。如果判断为是虚假信息,则会提交给审核团队,审核属实之后,虚假信息就会被系统屏蔽,不会给用户进行推送。
当然,蝙蝠公司的业务单元远远不止上述这几个,同时机器学习在这些业务单元中的应用也远远不止上述这几个方面。限于篇幅,本书就不再一一罗列了。
5.机器学习在蝙蝠公司之外的应用
蝙蝠公司代表的是互联网行业,然而在互联网行业之外,机器学习也被广泛的应用。例如在医疗行业中所使用的专家系统,典型的案例就是诞生于20世纪70年代的MYCIN系统,该系统由斯坦福大学研制,它可以用患者的病史、症状和化验结果等作为原始数据,运用医疗专家的知识进行逆向推理,找出导致感染的细菌。若是多种细菌,则用0到1的数字给出每种细菌的可能性,并在上述基础上给出针对这些可能的细菌的药方。
此外,还有诸如智能物流、智能家居、无人驾驶等领域。可以说机器学习,已经非常深切地融入了我们的生活与工作当中。
6.一些炫酷的“黑科技”
除了上述我们提到的已经广泛应用的领域,还有一些代表着未来发展趋势的案例,例如:2016年,Google旗下的AI程序AlphaGo首次战胜了人类围棋世界冠军。2017年,埃隆·马斯克创办的OpenAI公司开发的人工智能程序在电子竞技游戏DOTA中战胜了人类世界冠军Dendi。除此之外,还有很多诸如AI写新闻稿、画插画、写诗词等消息充斥着各大新闻网站的首页,仿佛用不了多久,AI就会在各个方面全面替代人类,进而统治世界了。
本书并不想争论AI究竟会让人类生活得更美好,还是会成为地球的主宰者奴役我们。在这里只想和大家一起探究一下这些案例背后的原理。不管是AlphaGo还是OpenAI,其背后的原理都是机器学习中的深度学习,它们的崛起在全球范围内掀起了一阵人工智能和深度学习的热潮。
实际上,人工智能这个概念并不是最近几年才出现的。早在20世纪60年代,人工智能就被提出,并且分为诸多学派。其中联结学派就是神经网络,或者说深度学习的代表。但受限于当时的计算能力,人工智能的发展也出现了停滞。
而随着时代的发展,现在的芯片计算能力越来越强,同时用户的数据量也越来越大,为人工智能的进一步发展提供了必要的先决条件,而机器学习、深度学习、神经网络等概念也随之火爆起来。同时在人才市场上,机器学习工程师、算法工程师、数据分析师等职位也呈现出了供不应求的场面,因此有更多的人开始投身到机器学习的研究当中。