从万物互联,看智能系统如何升级
信风智库:从智能化的角度看,万物互联将带给我们哪些挑战,我们又该如何应对?
约瑟夫·希法基思:万物互联是一个雄心勃勃的技术愿景,它的作用在于提高技术的效率和可预测性。这主要体现在两方面:一方面,通过统一的网络部署,让各种基础设施能够被远程感应和控制;另一方面,将现实世界与虚拟计算机系统进行有机整合。
整体上看,万物互联主要由两个部分组成,它们所要实现的目标大相径庭。
第一部分是人类物联网,它为用户提供智能服务的同时也在不断提升互联网技术。更具体地说,其核心愿景是走向所谓的“语义网”。“语义网”是蒂姆·伯纳斯·李在1998年提出的一个概念,试图通过给全球信息网上的文档添加能够被计算机所理解的语义——“元数据”,使整个互联网成为一个通用的信息交换媒介。
不同于传统搜索引擎的“单词式”检索,语义网更强调自然语言的表述。例如,我可以问:“在预算1万元的标准下,5月份最佳的海边度假地点是哪里?”
随后,搜索引擎将提供一个选项列表作为答案,这些选项将按照匹配程度进行排序。需要强调的是,尽管专家们在研究和开发方面作出了巨大努力,但“语义网”的这一愿景在很大程度上仍未实现。
万物互联的第二部分称为工业物联网。其核心思路是在复杂工业体系中逐步取代人类,从“自动化系统”转向“自主系统”。这是一个非常具有挑战性的变革。如今,我们已经非常熟悉自动化系统,它能根据设计要求在一定程度上控制设备、电器乃至车辆的运行。
自主系统则非常不同,它们能够在没有人类直接干预的情况下进行长期工作。自主系统的目的是代替人类,需要应对非常复杂的网络物理环境,它们必须同时处理许多不同的目标,而且还要与部分人类合作。当前主要用于智能运输系统、智能电网、智能农场和智能工厂等场景。
目前,工业物联网主要面临两个问题。
第一个问题是网络基础设施与系统的可靠性问题。目前,大部分工业物联网系统可靠性较低,甚至达不到最基础的安全与保障。时至今日,随着连接设备的不断增加,工业物联网系统所面临的风险也越来越高,我们尚未探索出如何保证大型异构系统安全性的办法。
第二个问题是分布式系统的安全性问题。在当前的技术水平下,受制于认知和计算的复杂性,我们很难保证地理分布式系统的安全,除此之外,还需要考虑使用人工智能技术带来的额外问题,因为我们无法保证它的决策时刻符合人类的预期。
总的来说,尽管人工智能、5G和大数据等新一代信息技术在很多领域都取得了重大进展,但迈向万物互联的道路将比我们预期的更长,科学技术的突破能力将决定这项事业的最终结果。
信风智库:结合您的研究,您认为弱人工智能迈向强人工智能还需要解决哪些问题?
约瑟夫·希法基思:我想先强调一下弱人工智能和强人工智能之间的区别。
弱人工智能的作用在于解决运算复杂、重复性较高的任务。比如,打造一个围棋训练系统或者高阶方程计算系统。在这样的特定场景中,弱人工智能的表现一定优于人类,因为系统的规则和定义是简单且重复的。可一旦改变应用场景,系统便会失去作用。
强人工智能的目标是接近人类智能,其特点是能够管理许多属性不同的潜在冲突目标,包含短期目标和长期目标。如家庭管理、职业规划和社交沟通等复杂的任务,要求系统必须具备预测外部环境的能力。
虽然只有一字之差,但弱人工智能和强人工智能之间存在着很大的差距。对于弱人工智能来说,计算是唯一的复杂性问题,而对于强人工智能来说,前文提到的所有复杂性问题都会涉及。
20世纪七八十年代,强人工智能的研究者们发现,实现人工智能的认知和推理是难以跨越的障碍。于是很多科学家和工程师们转向了更加实用的、工程化的弱人工智能研究。毫无疑问,他们在这些领域取得了丰硕的成果:人工神经网络、支持向量机……甚至最简单的线性回归理论在足够大的数据量和计算量支撑下,都可以获得令人满意的结果。这些技术变成了如今的人脸识别与语音识别等常见的功能,可即便如此,弱人工智能依然和强人工智能差得很远。
那么,从弱人工智能到强人工智能需要解决哪些问题呢?我认为主要有两点:
第一个问题是,今天的机器在“情况意识”方面无法超越人类。人类拥有“常识性知识”,这些知识是在生活中逐步建立的。常识性知识代表储存在我们记忆中的概念和事件之间的关系。这些关系通过日常训练逐步建立,无需特殊的学习过程。
举个例子,给一张木头和火柴的照片,人类会自然而然地联想到“火”。但这对于机器而言并不容易,因为它们缺乏这种常识推理能力。迄今为止,常识推理能力已经困扰了人工智能领域近50年。
2019年,知名人工智能研究机构OpenAI发布GPT-2语言交流系统,这个具有15亿参数的通用语言模型一时引发了巨大的轰动,还曾被《经济学人》杂志作为对象“采访”过。该模型生成的句子流畅度惊人,几乎能以假乱真,以至于OpenAI公开表示,因担心它太过优秀带来社会安全隐患而没有将模型完全公开。
随后,一位测试人员在GPT-2中输入了“当你把引火柴和木头堆在壁炉里,然后往里面扔几根火柴时,你一般是要...... ? ”如果这套系统足够聪明,那么它一定会回答“生火”之类的词语,但事实却是一段毫无逻辑的错句。这种对世界的基本知识进行推理的能力,几十年来一直都是人工智能领域难以逾越的大山之一。
倘若要让人工智能具备相同的能力,那么它们必须拥有一个常识性知识的数据库。大部分常识类知识具有隐式属性,使得相关信息难以被明确表示出来。虽然早期研究者认为,可以通过把现实世界的事实都记下来构建一个知识库,并以此作为实现自动化常识推理的第一步。然而这种做法实现起来远比听起来难。
第二个问题是如何使人工智能学会处理“新问题”。瑞士植物学家让·皮亚杰说:“智力不是你知道什么,而是当你不知道时会做些什么。”当遇到一个新问题时,人类懂得如何建立一套完整的解决方案,并通过举一反三的能力解决新问题。
最近几年,人工智能也开始探索从单一向综合转变,它需要系统同时具备模块识别和决策智能的能力。模块识别方面,单一的人工智能系统已经能够达到90%左右的准确性。然而,在决策智能方面,我们需要将模式识别的结果转化为现实世界中实实在在的决策。通常来说,这种决策并不是相互独立的,而是需要同时对多个问题做出决策,甚至还有可能伴随着较高的风险。正因如此,人工智能的目标也发生了本质变化,不再只是研究如何在单个计算机上重现人类智能,更重要的是如何构建现实世界中的系统,从而解决现实世界中的超大规模问题。简而言之,人工智能正逐步由原理研究走向人工智能综合工程。
这种认知的改变,与传统的人工智能研究的目标有很大差异。当前,人工智能更多的是解决交通、医疗、应急和金融等全球范围内的超大规模问题,而不再拘泥于下象棋等初级型态。