制造业大模型的构建与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.1 人工智能发展的三起三落

辩证唯物主义认为,事物的发展并不是简单的直线前进,而是遵循螺旋式上升的规律。人工智能的发展也不例外,经历了多次高峰与低谷的波动,才走到今天。

1.人工智能的诞生(20世纪40年代到50年代)

大脑是人类智能的载体。要让机器富有智能,模仿人类大脑是一个可行的途径。在20世纪40年代和50年代,来自数学、心理学、工程学、经济学和政治学等不同领域的科学家们开始探讨制造人工大脑的可能性。

1943年,美国神经生理学家沃伦·麦卡洛克和数学家沃尔特·皮茨合作,对大脑的神经元进行类比和建模,提出了麦卡洛克-匹兹模型(McCulloch-Pitts model),简称MP模型。MP模型是早期的神经元网络模型,开创了人工神经网络的先河。生物神经元的工作机制是,当其受到外界刺激并积累到一定程度时才会做出反应,如图2-3所示。参考神经元的结构和工作原理,MP模型描述了一个抽象并简单的人工神经元,如图2-4所示。其中,加和的效果可类比于生物神经元的刺激累积,在达到一定的阈值后通过触发激活函数来做出反应,是生物神经元的一种数学化表述。

图2-3 生物神经元结构

图2-4 MP模型结构

1950年,著名的图灵测试诞生。“人工智能之父”艾伦·图灵设定了一个关于机器智能的评判标准。如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么这台机器便被认为具备了智能,如图2-5所示。

图2-5 图灵测试

1956年夏天,达特茅斯会议召开。会议足足开了两个月的时间,尽管与会者们未能达成普遍共识,却定义了人工智能的概念。因此,1956年成为人工智能元年。

2.人工智能的黄金时代(20世纪50年代到70年代)

达特茅斯会议之后,人工智能的发展迅速进入了黄金时代。在这期间,英美等国家的一些政府机构向这一新兴领域投入了大笔资金,专注于人工智能领域的探索。大批研究机构也相继成立。

同时,大量的人工智能程序被开发出来用于解决代数应用题、证明几何定理甚至下棋。例如,麻省理工学院开发的SHRDLU系统,可以理解并执行简单的自然语言命令;斯坦福研究所研制出了第一台移动机器人Shakey,它能够通过感知环境并运用逻辑推理进行导航;美国计算机科学家亚瑟·李·萨缪尔研制的计算机跳棋程序打败了当时的跳棋大师。

3.人工智能的第一次低谷(20世纪70年代到80年代)

好景不长,人工智能的发展迎来了第一次低谷。当时的计算机凭借其有限的内存和处理速度,不足以解决任何实际的问题。研究者们对其课题的难度未能做出正确判断,导致雄心勃勃的研究课题只收获了用于下下棋的程序,过高的期望也就变成了巨大的失望。当研究者的承诺无法兑现时,政府的资助也就缩减甚至取消了。

一度备受关注的人工神经网络——感知机,也遭到强烈质疑。感知机存在结构上的严重缺陷。因为单层感知机本质上是一个线性分类器,无法求解非线性分类问题,甚至对简单的异或问题都无法求解,如图2-6所示。

图2-6 单层感知机无法求解简单的异或问题

4.人工智能的繁荣期(20世纪80年代)

在1980年代,专家系统开始出现,如图2-7所示。专家系统是一种模拟人类专家知识管理和决策过程的程序系统。通过将特定领域的专业知识编码为一系列规则和逻辑推理机制,专家系统能够在医学诊断、地质勘探、化学合成等领域提供辅助决策服务。专家系统的成功开发和商业化应用带来了投资热潮。

图2-7 专家系统

1981年,日本政府拨款支持第五代计算机项目,其目标是造出能够与人对话、翻译语言、解释图像,并且能像人一样进行推理的机器。其他国家纷纷响应,开始为信息技术领域的研究提供大量资金。

1982年,美国物理学家约翰·霍普菲尔德发明了一种新型的神经网络(现被称为“霍普菲尔德网络”),能够用一种全新的方式学习和处理信息。同时期,美国心理学家大卫·鲁梅尔哈特等人推广了反向传播算法。

5.人工智能的第二次低谷(20世纪80年代末到90年代中期)

然而,由于维护成本高昂和通用性不足等问题,专家系统到20世纪80年代末期陷入困境。随着人们对专家系统局限性的认识加深,以及全球经济环境的变化,投资者和政府对人工智能项目的资助开始大幅度减少,许多研究计划被取消或削减,导致大量研究人员流失,转投其他学科领域。AI寒冬再次来临。

1991年,日本第五代计算机项目的目标并没有实现。后来,美国国防高级研究计划局的新任领导认为人工智能并非“下一个浪潮”,拨款倾向于那些看起来更容易出成果的项目。

6.人工智能重新崛起与深度学习时代(20世纪90年代中期到2016年)

从20世纪90年代中期开始,人工智能领域迎来了一个相对平稳的发展期。在经历了前几十年的起起落落之后,研究者们开始深入探索及完善各种算法和理论。在机器学习和数据挖掘领域,涌现出一系列的创新和突破,如支持向量机等机器学习算法取得了巨大的成功。

计算能力的提升和数据量的增长为人工智能的研究提供了更为肥沃的土壤。20世纪90年代,计算性能上的基础性瓶颈被逐渐攻克。图形处理器(Graphics Processing Unit,GPU)的并行计算优势被发掘出来,尤其对训练深度学习模型起到了革命性的作用。2000年后,GPU开始广泛应用于大规模机器学习任务。

2010年代以来,人工智能步入深度学习时代。大量的深度学习算法犹如雨后春笋般出现,并取得了令人惊叹的成绩。在一些任务中,深度学习算法的能力已经超越人类。例如,ImageNet大规模视觉识别挑战赛中,AI的图像识别错误率已经缩小到约2.9%,远低于人类肉眼的错误率5.1%,以至于该项赛事在2017年正式结束。

在20世纪90年代中期之后的二十多年里,人工智能领域如同处在温暖的春天里,其众多前沿应用令人倍感振奋与鼓舞。

❑ 1997年,IBM的计算机“深蓝”经过改良后击败国际象棋世界冠军加里·卡斯帕罗夫,标志着人工智能技术的重要进步。

❑ 2011年,IBM的计算机“沃森”在美国的一档智力竞赛电视节目中击败两位排名最高的选手,展示出其在自然语言处理和知识推理方面的强大能力。

❑ 2016年,AlphaGo击败围棋世界冠军李世石,如图2-8所示。这一次的人机对弈让人工智能正式被世人熟知,并引爆了整个人工智能市场。

7.大模型时代(2017年至今)

AlphaGo大战李世石之后,人工智能技术在全球范围内掀起了革新风暴,科研机构与企业纷纷加大投入,深度学习、强化学习、对抗神经网络等技术飞速发展,不断在图像与自然语言领域突破各项任务指标。

2017年,谷歌研究人员在论文“Attention Is All You Need”中提出了Transformer的概念,奠定了大模型时代的基石,如图2-9所示。此后,基于Transformer架构的预训练模型出现井喷,如BERT、GPT、T5等,大模型时代由此开启。

图2-8 李世石与AlphaGo的棋局

图2-9 论文“Attention Is All You Need”

2022年底,AI科技新贵公司OpenAI推出全新的对话式通用人工智能工具——ChatGPT。ChatGPT上线后,5天后活跃用户数高达100万,2个月后活跃用户数已达1亿,成为历史上增长最快的消费者应用程序。2023年,ChatGPT火遍全球,无人不知,无人不晓。之后,各大科技厂商和科研机构不甘落后,奋起直追,纷纷投入到大模型的研究中,一时间呈现“百模大战”之壮观景象,一波大模型竞赛由此引发。