1.8 未来展望
目前,人工智能虽然已经取得了引人瞩目的成功,但这还远远不是它的巅峰,还有巨大的发展潜力。
人工智能可以从某种程度上分成3类,弱人工智能(Artificial Narrow Intelligence)、通用人工智能(Artificial General Intelligence)和超人工智能(Artificial Super Intelligence)。弱人工智能是指机器的智能在一些特定领域(或具体任务)上接近或超越人类的水平;通用人工智能是指机器在所有需要智能的方面具备和人一样解决各种问题的能力;超人工智能是指机器具备全方面超越人脑的能力,包括思维、创造性和社交能力。目前,人类取得的成果还局限在弱人工智能方面,但对通用人工智能的研究已经在进展中了。
对于神经网络的研究,也在不断进化中,例如对本次人工智能发展居功不小的反向传播算法,它的创始人之一辛顿最近已经对它提出了质疑,认为它不是人脑思考的方法(这也是人工神经网络和生物神经网络的最大区别之一),并提出了新的研究方向。无论其研究结果如何,不断地质疑、不断地进步是科学界正能量的体现。也祝愿人工智能行业能够获得更大的发展,更好地造福人类。下面列举近年来人工智能已经获得一定成功并很有希望获得更大成功的一些成果和一些有趣的案例作为本节的收尾。
• 由Richard Zhang等人研发的运用深度学习技术自动给黑白照片上色的系统(见图1.8),使用了8个以上卷积层的多层神经网络,效果非常不错。
图1.8 用人工智能技术给黑白照片上色
• 著名的显卡生产公司英伟达(NVIDIA)提供的GPU对于人工智能特别是深度学习的发展起了很大的推动作用。英伟达公司也研发了一款“自动驾驶端到端深度学习系统”(End-to-End Deep Learning for Self-Driving Cars),如图1.9所示。在这个系统中,使用多层的卷积神经网络,从放在汽车前面的一个摄像头获取的最原始的图像数据为输入去学习自动驾驶的命令。
图1.9 自动驾驶端到端深度学习系统
• Scott Reed、ZeynepAkata、Xinchen Yan、Lajanugen Logeswaran、BerntSchiele和Honglak Lee等人2016年提交的论文Generative Adversarial Text to Image Synthesis(见图1.10)中,提出了用一种很有前景的深度学习神经网络——生成式对抗网络(Generative Adversarial Network,GAN)来实现根据文字内容生成图片的方法。
图1.10 用人工智能进行文字到图像的生成
• 斯坦福大学学生Karpathy等人做的在网页浏览器中实现训练深度学习神经网络来进行图片分类与识别的项目(见图1.11)。
图1.11 人工智能实现图像分类的生成
• 谷歌、微软、亚马逊、MathWorks等大公司都对图像中的物体识别或定位做了很多研究并已取得很多成果,图1.12是来自Javier Rey的探讨计算机视觉中这几个问题的一篇博文。
图1.12 人工智能进行图片中的物体识别
• 所谓计算机视觉中的语义分界,指的是从一张图片中,划分出各个物体的边界范围。图1.13就示意了来自麻省理工学院科学与人工智能实验室研制的系统从一张照片中,成功标记出了汽车、草坪、树、天空、道路等物体的边界范围。
图1.13 人工智能进行语义边界的划分
• Yannis M.Assael、Brendan Shillingford、Shimon Whiteson和Nando de Freitas等人提出的唇语识别系统LipNet是使用了深度学习的神经网络,虽然论文方面出现了一些波折,但作为一个深度学习应用,成功地把从视频中识别唇语的准确度达到了90%以上,已经超过了一般的人类识别水平,不能不说在实用化方面是有价值的(见图1.14)。
图1.14 LipNet某一个落地项目的网站
• 人工智能系统在艺术领域也有了不凡的造诣,图1.15和图1.16分别是笔者在某网站利用人工智能进行基于模板的自动绘画系统中随便涂抹后由系统自动生成的卡通风格风景画,还挺像模像样的。
图1.15 修改人工智能画的范围模式
• 谷歌的机器翻译系统GNMTS(Google Neural Machine Translation System)使用了基于深度学习的技术来训练系统,2016年宣布,在英语到法语互译、英语到西班牙语互译方面,已经非常逼近人类的翻译水平,如果6分是满分,机器翻译与人工翻译的已达到5.4和5.5这样的分数水平;中英文互译最差,但也在4.6和5.0这样的分数对比水平上。虽然这可能和实际使用系统的感觉还有差异,但不可否认比之前要提升了不少。
图1.16 用人工智能画的卡通风格画