第2章 人工智能发展带来价值观的重塑
从技术到产业:人工智能的革命性变革
人工智能是一种通过机器来模拟人类认识能力的技术。这门技术涵盖许多专业领域,如机器学习、深度学习、知识推理、人机交互、大数据分析、模式识别、自然语言处理、大规模计算系统和分布式系统等等。从概念形成到技术落地,人工智能经历了60余年的探索。然而,有关人工智能的思想古已有之,可以追溯到哲学、虚构和想象。在古代传说中就可以找到复制人、机器人的思想源头。例如古希腊神话《阿尔戈船英雄记》(Argonautica)中的铜制机器人塔罗斯(Talos);印度传说中阿阇世王(King Ajatasatru)派驻机器人武士守卫佛陀的遗物;中世纪出现了使用巫术或炼金术将意识赋予无生命物质的传说等。
人工智能的基本假设是人类的思考过程可以机械化。对于机械化推理的研究已有很长历史。其中著名的有亚里士多德(对三段论逻辑进行了形式分析),欧几里得(其著作《几何原本》是形式推理的典范),花剌子密(代数学的先驱,“algorithm”一词由他的名字演变而来)。早在13世纪,计算理论先驱、哲学家拉蒙·柳利(Ramon Llull)就开发了一些“逻辑机”,试图通过逻辑方法获取知识。17世纪,德意志数学家莱布尼兹(Leibnitz),英国理性主义传统奠基人托马斯·霍布斯(Thomas Hobbes)和法国数学家笛卡儿(René Descartes)尝试将理性的思考系统化为代数学或几何学那样的体系,这些哲学家已经开始明确提出形式符号系统的假设,而这一假设在后世成为人工智能研究的指导思想之一。
20世纪,数理逻辑研究上的突破为人工智能奠定了坚实的基础。这方面的基础著作包括英国数学家乔治·布尔(George Boole)的《思维的定律》与德国逻辑学家戈特洛布·弗雷格弗雷格(Gottlob Frege)的《概念文字》。基于弗雷格的系统,罗素和怀特海(Alfred North Whitehead)在《数学原理》中对数学的基础给出了形式化描述。这一成就激励希尔伯特(David Hilbert)向20世纪20年代和30年代的数学家提出了一个基础性的难题:“能否将所有的数学推理形式化?”这个问题的最终回答由哥德尔不完备定理、图灵机和阿隆佐·邱奇(Alonzo Church)的λ演算给出。他们,首先,证明了数理逻辑的局限性,其次,他们的工作隐含了任何形式的数学推理都能在这些限制之下机械化的可能性,这一点对人工智能极为重要。
20世纪40年代是人工智能的萌芽期。1943年,美国神经生理学家麦克·洛奇(W.McCulloch)和数理逻辑学家皮兹(W.Pitts)在《数学生物物理公报》上发表了关于神经网络的数学模型(M-P神经网络模型),通过总结神经元的一些基本生理特性,提出神经元形式化的数学描述和网络的结构方法,从此开创了神经计算的时代。1945年,美籍匈牙利数学家冯·诺依曼(John von Neumann)提出存储程序概念,1946年,第一台电子计算机ENIAC研制成功,它们都为人工智能的诞生奠定了物质基础。1948年,美国数学家香农(Claude E.Shannon)发表了划时代的论文《通讯的数学理论》,标志一门新学科——信息论的诞生。他认为人的心理活动可以用信息的形式来进行研究,并提出了描述心理活动的数学模型。1948年,美国应用数学家维纳(Norbert Wiener)创立了控制论,这是一门研究和模拟自动控制的生物和人工系统的学科,标志着人们根据动物心理和行为科学进行计算机模拟研究和分析的基础已经形成。
1956—1969年是人工智能的形成期。1956年夏季,约翰·麦卡锡(J.McCarthy)、马文·闵斯基(M.L.Minsky)等人在美国的达特茅斯学院围绕“如何用机器模拟人的智能”这一问题发起为期两个月的学术研讨会,提出“人工智能”这一术语,标志着这门学科的正式诞生。这一阶段,定理机器证明、问题求解、LISP语言、模式识别等关键领域均取得了重大突破。1956年,美国计算机科学家艾伦·纽厄尔(Allen Newel)和赫伯特·西蒙(Herbert Simon)建立了“逻辑理论家”程序,该程序可以模拟人们用数理逻辑证明定理时的思维规律,并证明了《数学原理》一书中第2章中的38条定理,后来经过改进,又于1963年证明了该章中的全部52条定理。这一工作受到了人们高度的评价,被认为是计算机模拟人的高级思维活动的一个重大成果,是人工智能的真正开端。
1956年,机器学习之父亚瑟·塞缪尔(Arthur Samuel)研制出具有学习功能的跳棋程序,该程序能够从棋谱中学习,也能在实践中总结经验。它在1959年打败了塞缪尔本人,又在1962年打败了美国一个州的跳棋冠军。这是模拟人类学习过程的一次卓有成效的探索,是人工智能的一个重大突破。1958年,约翰·麦卡锡(John McCarthy)研制出的表处理语言程序LISP,不仅可以处理数据,而且可以方便地处理符号,成为人工智能程序设计语言的重要里程碑。时至今日,LISP语言仍然是人工智能系统重要的程序设计语言和开发工具。1960年,纽厄尔、西蒙和克里夫·肖(John Clifford Shaw)等人研制了通用问题求解程序GPS,是对人们求解问题时的思维活动的总结。他们发现人们求解问题时的思维活动包括三个步骤:①首先想出大致的计划;②根据记忆中的公理、定理和解题计划,按计划实施解题过程;③在实施解题过程中,不断进行方法和目的的分析,修正计划。他们首次提出了启发式搜索的概念。
1968年,美国计算机科学家爱德华·费根鲍姆(Edward A.Feigenbaum)等人研制成功了化学分析专家系统DENDRAL,它的作用是分析质谱仪的光谱,帮助化学家判定物质的分子结构。这被认为是专家系统的萌芽,是人工智能研究从一般思维探讨到专门知识应用的一次成功尝试。专家系统的出现意味着人工智能开始从主要仅限理论的研究走向实际的应用方面,但同时它的研究从一般思维走向了专门知识应用,亦即科学家的努力更形而下,更“弱人工智能”了。此时,因为机器学习的模型仍然是“人工”的,所以随着专家系统应用的不断深入,它自身存在的知识获取困难、推理能力弱、前期人工费用高昂等缺点也暴露出来,人工智能研究开始退潮。1974—1980年,人工智能的不成熟和人们对先前巨额投资未能产生预期收益的失望,使其进入第一次低谷。
1981年,日本向世界宣告要开始研发第五代计算机,引起美国、欧洲、苏联等国家和地区在20世纪80年代中期相继再次立项支持人工智能研究。1986年,加拿大计算机科学家杰弗里·辛顿(Geoffrey Hinton)等人提出了反向传播算法,它是深度学习的基础理念。随着知识工程等机器学习方法的改进、机器学习开始采用决策树模型和多层人工神经网络等,人工智能进入第二次繁荣期。1987—1993年,计算机性能已有了长足的进步,试图通过建立基于计算机的专家系统来解决问题,但是由于数据较少并且太局限于经验知识和规则,难以构筑有效的系统,资本和政府支持再次撤出,人工智能迎来第二次低谷。不过在这期间,人工智能的研发仍然在持续,网络技术特别是互联网技术的发展,促使人工智能进一步走向实用化。到20世纪末,人工智能领域再度春暖花开,其标志性事件是1997年国际商业机器公司(IBM)深蓝超级计算机大胜国际象棋世界冠军卡斯帕罗夫(Garry K.Kasparov)。
2006年,在辛顿和他的学生的推动下,深度学习开始备受关注。随着各种机器学习算法的提出和应用,特别是深度学习技术的提高,人们希望机器能够通过大量数据分析,从而自动学习知识并实现智能化。这一时期随着计算机硬件水平的提升,大数据分析技术的发展,机器采集、存储、处理数据的水平有了大幅提高。从对实际应用的贡献来说,深度学习可能是机器学习领域最近十年来最成功的研究方向。2010年以后,深度学习技术对知识的理解比之前浅层学习有了很大的进步,推动语音识别、图像识别和自然语言处理等技术取得了惊人突破,推动人工智能和人机交互大踏步前进。许多专用方向的人工智能能力已经超越人类,比如围棋、德州扑克,证明数学定理,学习从海量数据中自动构建知识,识别语音、面孔、指纹,驾驶汽车,处理海量文件等。深度学习带来了机器学习的一个新浪潮,受到从学术界到工业界的广泛重视,也导致了“大数据+深度模型”时代的来临,进而迎来了人工智能新一轮的发展浪潮。
自第一次工业革命以来,技术创新一直是经济发展的根本推动力。人们在关注技术对经济长期增长作用的同时,也意识到并非所有的技术都具有同等的重要性,只有革命性的技术进步才能推动人类经济社会转型。自18世纪60年代起,人类经历的三次工业革命,分别以机械技术、电气技术和信息技术为核心驱动力。2016年,世界经济论坛将人工智能定义为第四次工业革命的基石。2017年,联合国在研究报告《新技术革命对劳动力市场和收入分配的影响》中指出,人工智能与蒸汽技术、电气技术一样,都是人类用于改造自然的通用目的技术(General Purpose Technology,GPT)。每一次工业革命的高潮都以驱动它的核心技术进入工业大生产阶段,呈现出标准化、自动化、模块化的特征为标志。人工智能的发展史表明,前几轮人工智能发展浪潮都遭遇了技术瓶颈制约,导致商业化应用难以落地,最终重新陷入低潮。但是目前新一代人工智能已经具备很强的通用性,本轮人工智能浪潮的技术上限和商业化潜力都大大高于以往,这意味着其已经为进入工业大生产阶段做好了准备。