前言
深度学习与智能的本质
如果你在连接了互联网的安卓手机或谷歌翻译平台上使用语音识别功能,你其实是在与经过深度学习训练的神经网络进行交流。过去几年,深度学习为谷歌带来了丰厚的利润,足以支付Google X实验室中所有未来主义项目的成本,包括自动驾驶汽车、谷歌眼镜和谷歌大脑。谷歌是最早拥抱深度学习的互联网公司之一,并在2013年聘请了深度学习之父杰弗里·辛顿(Geoffrey Hinton),其他公司也在竞相追赶它的脚步。
人工智能近期取得的进展得益于大脑逆向工程。分层神经网络模型的学习算法受到了神经元之间交流方式的启发,并依据经验进行了改进。在网络内部,世界的复杂性转变为五彩缤纷的内部活动模式,这些模式是智能的元素。我在20世纪80年代研究的网络模型很小,相比之下,现在的模型有数百万个人造神经元,深度达到了几十层。持久的努力、大数据和更强大的计算机运算能力使得深度学习在人工智能领域一些最困难的问题上取得了重大突破。
我们并不善于想象新技术对未来的影响。谁能在1990年互联网刚开始商业化的过程中预见到它对音乐产业的影响,以及对出租车业务、政治运动,还有我们日常生活几乎所有方面的影响?同样,我们也未能预见到电脑会如何改变我们的生活。IBM(国际商业机器公司)总裁托马斯·沃森(Thomas J. Watson)在1943年说的一句话后来被广泛引用:“我觉得全世界也许能卖出5台计算机吧。”很难想象一个新发明都有哪些用途,其发明人对这些用途的预测也不见得比其他人更准确。在乌托邦和世界末日的两极之间,有很多关于深度学习和人工智能应用场景的预测空间,但即使是最具想象力的科幻小说作家也不大可能猜出它们最终会产生什么样的影响。
本书的初稿是我在太平洋西北地区徒步旅行,并思索了近几十年来人工智能领域的显著变化之后写出来的。这本书讲了一个一小群研究人员挑战AI研究建制派的故事,这些建制派在当时拥有更充足的资金支持,并被看作“唯一的主导力量”,他们大大低估了这些问题的难度,并且所依赖的对智能的直觉,后来被证明是有误导性的。
地球上的生命充满了无数奥秘,但最具挑战性的也许是智能的本质。自然界充斥着各种形式的智能,从微小的细菌到复杂的人类智能,每种智能都适应了它在自然界中的位置。人工智能也将以多种形式出现,并在智能族谱中占据特殊的位置。随着基于深度神经网络的机器智能日渐成熟,它可以为生物智能提供一个新的概念框架。
这是一本关于深度学习的过去、现在和未来的指南。不过本书并不是对该领域发展历史的全面梳理,而是记录了这一领域重要概念的进步及其背后研究群体的个人观点。人类的记忆并不可靠,对故事的每次复述都会导致记忆的偏差,这个过程叫作“重整记忆”。这本书中的故事延续了40多年,尽管有些对我来说依然历历在目,就像昨天刚发生的一样,但我很清楚,那些故事在我的记忆中不断被复述时,有些细节已经悄悄地被改写了。
本书的第一部分提供了深度学习的动机和理解其起源所需的背景信息;第二部分解释了几种不同类型的神经网络架构中的学习算法;第三部分则探讨了深度学习对我们当下生活产生的影响,以及未来若干年可能产生的影响。然而,正如纽约扬基队的哲人尤吉·贝拉(Yogi Berra)曾经说过的那样:“做出预测很难,特别是对未来的预测。”本书前八章的内容交代了故事的技术背景;三个部分开头的要事年表记录了与这个故事有关的事件,时间跨度超过了60年。