2020—2021年中国人工智能产业发展蓝皮书
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二节 人工智能技术表现

尽管技术的进步使AI系统的部署比以往任何时候都更加广泛和轻松,但对AI使用的关注也在增长,尤其是在算法偏差等问题上,比如,能够合成图像和视频的新AI功能的出现也带来了道德上的挑战。

万物皆可生成成为可能。AI系统可以合成非常高质量的文本、音频和图像,人类甚至无法分辨出合成输出与非合成输出之间的区别。在2020—2021年,生成模型在STL-10 数据集中生成令人信服的合成图像方面进展迅速,图像真实性越来越高。这些技术将促进大量有利于社会或不利于社会的AI下游应用的出现,并促使研究员投入研究检测生成模型的技术中。

计算机视觉技术(CV)正加速工业化,视频处理将是下一个风口。CV模型的性能在一些大型基准上开始趋于平缓,这表明社区需要开发并就更难的标准达成共识,以对性能进行进一步测试。同时,企业正在投入越来越多的计算资源,以前所未有的速度训练CV系统。

自然语言处理技术(NLP)能力已经超越其评估指标。NLP的进展加快,技术进步已经超过了基准测试,这可以从在SuperGLUE上获得人类水平性能的系统的快速兴起看出。

AI推理取得显著进步。大多数技术问题的度量标准都以固定的基准显示了每个时间点上最佳系统的性能。针对AI指数开发的新分析提供了指标,这些指标可以用在不断更新的基准测试上,也可以用在获得一段时间内一组系统整体性能表现的单个信用系统上。AI推理分析适用于两个符号推理问题:自动定理证明(Automated Theorem Proving)和布尔公式的可满足性(Satisfiability of Boolean formulas)。在布尔满足问题上,虽然从 2016年到 2018年最佳求解器的性能没有明显变化,但在 2019年和 2020年有明显的改进。

机器学习(ML)正在改变医疗保健和生物学领域。DeepMind开发的AlphaFold 2 应用了深度学习技术,在长达数十年的蛋白质折叠生物学挑战中取得了重大突破。科学家使用ML模型来学习化学分子的表示形式,以进行更高效的化学合成规划。AI创业公司PostEra使用基于ML的技术,在新冠肺炎疫情期间快速找到了相关的药物。