3.4 类脑智能
互联网搜索、视频监控、交通调度、语音识别、人脸识别、人机交互、机器翻译等技术应用的背后都有人工智能的支撑,大数据的出现和计算能力的提升,不断推动人工智能向前发展。模式识别是对表征物体或现象的各种形式数据(主要是感知数据,如图像、视频、语音等)进行处理和分析,以便对物体或现象进行描述、分类和解释的过程,是信息科学和人工智能的重要组成部分。随着计算机硬件的发展,人们对模式识别的关注度不断提高,模式识别技术发展也日臻完善,且在许多领域中有成功应用。例如,金融、安全、医学、航空、互联网、工业产品检测等领域都应用了模式识别技术。
3.4.1 模式识别与人工智能
模式识别有两个层面的含义:一是指生物体(主要是人脑)感知环境的模式识别能力与机理,属于心理学和认知科学范畴;二是指面向智能模拟和应用,研究让计算机实现模式识别的理论和方法,属于信息科学和计算机科学范畴。模式识别基础理论(模式表示与分类、机器学习等)、视觉信息处理(图像处理和计算机视觉)、语音语言信息处理(语音识别、自然语言处理、机器翻译等)是模式识别领域的三大主要研究方向。
模式识别是人工智能的一个分支。人工智能通过计算使机器模拟人的智能行为,主要包括感知、思维(推理、决策)、动作、学习,而模式识别主要研究其中的感知行为。在人类的五大感知行为(视觉、听觉、嗅觉、味觉、触觉)中,视觉、听觉和触觉是人工智能领域研究较多的方向。模式识别主要研究视觉和听觉感知。文字识别、语音识别、生物特征识别(虹膜识别、指纹识别、掌纹识别、人脸识别等)都是目前发展较为成熟的模式识别技术。
模式识别和人工智能在20世纪60年代分离为不同的领域,自21世纪以来出现了重新融合的迹象。近年来,深度学习和大数据的出现推动了模式识别的快速发展。这一领域还有巨大的进步空间,一方面,基础理论研究进展不大;另一方面,有很多具有挑战性的应用问题有待解决。当前人工智能存在两条技术发展路径:一条是以模型学习驱动的数据智能;另一条是以认知仿生驱动的类脑智能。现阶段人工智能发展的主流技术路径是数据智能,但数据智能存在3个明显的局限性:一是需要大量的标记样本进行监督学习,这势必增加模式识别系统开发中的人工成本;二是模式识别系统的自适应能力差,自主学习、自适应等能力弱,高度依赖于模型构建,不像人的知识和识别能力是随着环境不断进化的;三是模式识别系统一般只进行分类,没有对模式对象进行解释。数据智能缺乏逻辑分析,仅具备感知识别能力,推理能力不足;时序处理能力弱;仅解决特定问题,适用于专用场景。
类脑智能可以解决数据智能的局限性。在数据方面,类脑智能可处理小数据、小标注问题,适用于弱监督和无监督问题;自主学习、关联分析能力强,鲁棒性较好;计算资源消耗较少;逻辑分析和推理能力较强,具备认知推理能力;时序相关性好;可能解决通用场景问题,可用于实现强人工智能[3]。
近年来,随着计算机科学、神经科学和神经网络理论的发展,面对大数据时代对智能计算的需求,以及传统人工智能深度学习方法的不足,科学家开始将研究重点转向类脑智能,即脑启发的智能(Brain-Inspired Intelligence)。从目前研究情况来看,人类对大脑神经结构和功能的研究有了很大的进展,同时,认知科学也对人的智能行为(包括学习、记忆、注意、推理、决策等)机理进行了深入研究。这使得受大脑神经结构和认知行为机理启发,研制具有更强信息表示、处理和学习能力的智能计算模型与算法成为可能。
3.4.2 类脑智能的概念
类脑智能是受大脑神经结构和认知行为机理启发,以计算建模为手段,通过软硬件协同实现的机器智能。类脑智能系统的特点表现为:在信息处理机制上类脑,在认知行为表现上类人,在智能水平上达到或超越人。类脑智能的目标是使机器以类脑的方式实现人类具有的各种认知能力及其协同机制,最终达到或超越人类的智能水平,具体来说,就是在结构层次模仿脑,在器件层次逼近脑,在功能层次超越脑。结构层次,主要研究基本单元(各类神经元和神经突触等)的功能及其连接关系(网络结构),通过神经科学实验中的分析探测技术来完成;器件层次,重点在于研制模拟神经元和神经突触功能的微纳光电器件,在有限物理空间和功耗条件下构造出类似人脑规模的神经网络系统,如研制神经形态芯片、类脑计算机;功能层次,对类脑计算机进行信息刺激、训练和学习,使其产生与人脑类似的智能甚至涌现自主意识,实现智能培育和进化,如学习、记忆、识别、会话、推理及决策等。
从大方向上来说,类脑智能研究主要有硬件和软件两个方面。软件研究又有两个角度:一是使智能计算模型在结构上更加类脑;二是使智能计算模型在认知和学习行为上更加类人。这两个角度的研究都会产生有益的模型和方法。例如,模拟人的少样本和自适应学习,可以使智能系统具有更强的小样本泛化能力和自适应性。
硬件方面的研究主要是研发类脑新型计算芯片,如神经网络计算芯片,目标是相比于当前的CPU和GPU计算架构,提高计算效率和降低能耗。目前人工神经网络主要通过在通用计算机上编程来实现,能耗比较高。例如,一台计算机的功率为200~300W ,一台GPU服务器的功率至少为2000W,而人脑的功率只有20W。由于计算机实现大规模人工神经网络的功耗非常大,因此,研发新型的神经网络计算芯片,能够降低能耗,具有重要的现实意义。
未来的类脑智能研究,应该在结构类脑和行为类人方面更加深入。目前,不管是神经结构模拟还是学习行为模拟,都是比较粗浅的。以学习为例,当前主流的监督学习采用比较“粗暴”的学习方式,即一次性用大量的类别标记数据对人工神经网络进行训练,而收集大量标记数据是要付出很大代价的。人脑的学习具有很强的灵活性,其从小样本开始,不断地随环境自适应。这种学习灵活性应该是未来机器学习的一个主要研究目标。
随着脑成像、生物传感、人机交互等新技术不断涌现,脑科学正成为多学科交叉的重要前沿科学领域,也是众多国家的科技战略重点。早在2015年,中国科学家就对脑科学与类脑研究在中国“一体两翼”的部署达成了初步共识[4]。一体指脑认知功能研究,从脑科学和神经科学角度研究脑神经的结构与认知功能;两翼指脑科学应用研究:一是脑疾病的诊断、预测、治疗,二是类脑智能研究。类脑智能和当前主流的基于传统计算的人工智能方法将并行发展,相互取长补短。脑科学借助人工智能等信息技术,能够探索人脑的新功能、新结构,人工智能借助人脑的新模型、新机制,能够实现机器智能及其应用,两者的发展呈现交叉汇聚的趋势。另外,从应用的角度看,人与机器协同工作、人的智能与机器智能互补也是必然趋势。
脑科学和类脑智能的全球性研究热潮反映了科学界与各国政府的3点共识:第一,脑科学是人类理解自然界现象和人类本身的终极疆域,是21世纪最重要的前沿学科之一;第二,脑疾病所带来的社会经济负担已超过心血管病和癌症,脑科学的发展对脑疾病的诊断治疗将有关键性的贡献;第三,计算机技术和人工智能发展至今已面临瓶颈,对人脑认知神经机制的理解可能为新一代人工智能算法和器件的研发带来新启发。
3.4.3 类脑智能的技术框架
类脑智能的技术框架分为基础理论层、硬件层、软件层、产品层4层,如图3-2所示。基础理论层基于脑认知与神经计算,主要从生物医学角度研究大脑可塑性机制、脑功能结构、脑图谱和大脑信息处理机制等。硬件层主要研究具有类脑功能的神经形态芯片,也就是非冯·诺依曼架构的类脑芯片,如脉冲神经网络芯片、忆阻器、忆容器、忆感器等。软件层包含核心算法和通用技术,核心算法主要指弱监督和无监督机器学习机制,如脉冲神经网络、增强学习、对抗神经网络等;通用技术主要包含视觉感知、听觉感知、多模态融合感知、自然语言理解、推理决策等。产品层主要包括交互产品和整机产品,交互产品包含脑机接口、脑控设备、神经接口、智能假体等;整机产品主要包括类脑计算机、类脑机器人等。
图3-2 类脑智能的技术框架
类脑智能当前存在先结构后功能和先功能后结构两条发展思路。先结构后功能,主要指先研究清楚大脑的生理结构,然后根据大脑运行机制研究如何实现大脑的功能;先功能后结构,主要指先使用信息技术模仿大脑的功能,在模仿过程中逐步探索大脑的运行机制,然后相互反馈促进。两条发展思路各有千秋,功能和结构的任意发展突破都会推动类脑智能极大地发展,因此,现阶段两条路线并行发展。
类脑智能目前整体处于实验室研究阶段,脑机接口技术是类脑领域目前唯一产业化的技术。脑机接口技术在人脑(或者脑细胞的培养物)与外部设备间建立直接连接通路,以“脑”为中心,以脑信号为基础,通过脑-机接口来控制人机混合系统。脑机接口技术应用于医疗领域,可实现让瘫痪人士通过脑机设备控制机械臂完成相应动作,也可实现对多动症、癫痫等疾病采取神经反馈方式进行对应的恢复训练;应用于智能家居领域,可实现通过意念控制开关灯、开关门、开关窗帘等,进一步控制家庭服务机器人。全球最受关注的脑机接口公司前10名多分布在北美和欧洲,我国产业界也在逐步推出相关的产品,如植入式脑微电极、脑控智能康复机器人等。