纵观AI产业版图
如果要选出2023年最热的几个话题,ChatGPT一定榜上有名。2023年初,ChatGPT席卷全球并成为流量热点,人们都在前赴后继地挖掘ChatGPT的各种潜能,探讨其未来发展趋势,甚至是与人类的关系。作为“人工智能家族”的大热应用,以ChatGPT为首的各大人工智能应用开始被越来越多的人关注,也引发了人们的更多思考。
人工智能技术被称为当代三大尖端技术之一,近年来在人们生活中的“存在感”也越来越强,这都是产业飞速发展的结果。想要清晰地了解以ChatGPT为代表的新兴智能技术,完整地认识人工智能,我们可以先从其产业版图的发展和现状入手。
其实,人工智能的发展、传播和被接受是经过了一段漫长的寒冬的。十多年前,它还只是一个不被人看好的小众领域,但是现在,它却已经成了街头巷尾的热点谈资,几乎任何事情都可以和人工智能联系在一起。短短十多年间,世界发生了天翻地覆的变化,新数据不断涌现,各种问题层出不穷,直到现在,人工智能的春天才算是真的到来了,各个领域都急需人工智能的帮助。这也是为什么人工智能的行业应用范围如此广阔,人工智能市场更是如一块一望无际的辽阔土地,有待进一步开发。如图1-1,这是一份人工智能的行业应用版图,不同的行业领域(零售、金融、医疗和教育等)与不同的职能方向(营销、风控和安全等)共同构成了一个人工智能应用矩阵,对于每个行业中的相关职能,人工智能都可以找到应用场景,例如在零售行业的供应链、营销、客服等方面以及金融行业的研发、营销、客服、风控等方面都已经有人工智能落地实践(图中蓝色表示)。但是,现在的人工智能只填充了广阔的行业领域中的一部分,还有更多没尝试和拓展的行业以及职能中的应用场景。
图1-1 人工智能的行业应用版图
从产业的视角来看,人工智能包括基础层、技术层和应用层。其中,基础层是人工智能产业的基础,为人工智能提供数据及算力支撑;技术层是人工智能产业的核心,主要包括各类模型和算法的研发和升级;应用层则是人工智能面向特定场景需求而形成的软硬件产品或解决方案。那么,人工智能的产业规模发展至何种程度了呢?英国德勤(Deloitte)的报告中预测,世界的人工智能产业规模会从2017年的6900亿美元增长至2025年的64 000亿美元,2017—2025年的复合增长率将达到32.10%,整体呈现出飞速攀升的趋势。另外,人工智能近几年成了各个行业在进行投资的热门选择。人工智能完全称得上是风头正劲,受万人追捧,为经济带来了十分显著的增量。
在产业应用上,人工智能发展到今天,我们能看到其在各个行业都有用武之地:制造业、零售业、金融业、医疗卫生行业……它在一定程度上改变了组织的运转方式,使其可以更快更好地解决遇到的问题,并压低各类成本。站在消费者的角度,人工智能的出现也为广大的用户群体带来了更多的选择。总的来说,人工智能可以看作一块已开始被打磨的原石,露出了它璀璨的一角,它在推动世界经济发展的同时,也将深层次地改变人类的生活。为了进一步了解AI产业版图,下面我们从两种不同的AI——决策式AI和生成式AI谈起。
决策式AI和生成式AI
人工智能可从不同的维度进行划分。如果按其模型来划分(人工智能是由模型支撑的)可以分为决策式AI和生成式AI。
决策式AI(也被称作判别式AI)学习数据中的条件概率分布,即一个样本归属于特定类别的概率,再对新的场景进行判断、分析和预测。决策式AI有几个主要的应用领域:人脸识别、推荐系统、风控系统、其他智能决策系统、机器人、自动驾驶。例如在人脸识别领域,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。再例如,决策式AI可以通过学习电商平台上海量用户的消费行为数据,制订最合适的推荐方案,尽可能提升平台交易量。
生成式AI则学习数据中的联合概率分布,即数据中多个变量组成的向量的概率分布,对已有的数据进行总结归纳,并在此基础上使用深度学习技术等,创作模仿式、缝合式的内容,相当于自动生成全新的内容。生成式AI可生成的内容形式十分多样,包括文本、图片、音频和视频等。例如,我们输入一段小说情节的简单描述,生成式AI便可以帮我们生成一篇完整的小说内容;再例如,生成式AI可以生成人物照片,而照片中的人物在现实世界中是完全不存在的。如图1-2,它展示的是国外一个网站生成的“不存在的人”的照片。
总的来说,不管是哪种类型的模型,它的基础逻辑是一致的:AI模型从本质上来说是一个函数,要想找到函数准确的表达式,只靠逻辑是难以推导的,这个函数其实是被训练出来的。我们通过喂给机器已有的数据,让机器从数据中寻找最符合数据规律的函数。所以当有新的数据需要进行预测或生成时,机器就能够通过这个函数,预测或生成新数据所对应的结果。
图1-2 “不存在”的人
图片来源:https://generated.photos/faces
决策式AI和生成式AI作为AI模型的两个主要分支,顾名思义,在诸多方面都有相异之处。
从宏观角度来看,决策式AI是一种用于决策的技术,它利用机器学习、深度学习和计算机视觉等技术来处理专业领域的问题,并帮助企业和组织优化决策。而生成式AI则是一种用于自动生成新内容的AI技术,它可以使用语言模型、图像模型和深度学习等技术,自动生成新的文本、图片、音频和视频内容。因此,决策式AI可以说是在对人类的决策过程进行模仿,但生成式AI就聚焦在创作新内容上。
而从微观上看,这两类技术的区别就更加明晰了,我们就从技术路径、成熟程度、应用方向这三个角度来挖掘其深层次的不同(表1-1)。
表1-1 决策式AI和生成式AI的对比
从技术路径来看,决策式AI的主要工作是对已有数据“打标签”,对不同类别的数据做区别,最简单的例子如区分猫和狗、草莓和苹果等,干的主要是“判断是不是”和“区分是这个还是那个”的活儿。生成式AI就不一样了,它会在归纳分析已有的数据后,再“创作”出新的内容,如在看了很多狗的图片后,生成式AI再创作出一只新的狗的图片,实现“举一反三”。
从成熟程度看,决策式AI的应用更为成熟,已然在互联网、零售、金融、制造等行业展开应用,极大地提升了企业的工作效率。而生成式AI的“年岁更小”,2014年至今发展迅猛,堪称指数级的爆发,已在文本和图片生成等应用内落地。
从应用方向来看,决策式AI在人脸识别、推荐系统、风控系统、机器人、自动驾驶中都已经有成熟的应用,非常贴合日常生活。生成式AI则在内容创作、人机交互、产品设计等领域展现出巨大潜力。
我们来举一些生活中的例子,以更深入地了解两者在日常生活中的应用。喜欢购物的读者都知道,你在购买某一类产品后,购物平台会自动给你呈现诸多同类或相关商品。这件事的背后就是,电商平台会根据用户常看的商品,剖析用户和商品的关联,从而有针对性地为用户推荐内容,而这项功能就应用了决策式AI技术。从2003年开始,亚马逊就将此技术应用到了电商领域,推荐的商品精准地匹配用户需求,可以极大地降低用户的搜索次数,并因此增加产品的销售额。由此你可能会发现,平台似乎比你更清楚你需要什么,自然而然,自己的消费额也跟着上去了。平台也凭借这个功能,让更多用户心甘情愿地掏了腰包,来获取更广阔的商业价值。
根据行业数据统计,在亚马逊的收入中约有40%来自个性化推荐系统,而推荐系统每年能给网飞(Netflix)带来10亿美元以上的产值。除了电商平台,新闻、音乐、视频等平台,也会利用个性化推荐系统为用户推荐内容,在剖析用户的长期兴趣和短期兴趣后,将精细化内容推送给用户,并可以通过对用户的停留、观看时间、点赞、收藏等行为特征的实时分析,精准刻画出用户画像,减少人工运营的介入,显著提升用户黏性,这已将人工智能的价值凸显无遗。在自动驾驶领域,AI可进行智能分析、识别路况,渗透率稳步提升。自动驾驶汽车可以借助决策式AI技术,分析判别各种路况,对多种物体进行识别与跟踪,提升行车安全。无须人工干预的自动驾驶汽车虽然现在并不成熟,但随着技术的迭代升级,有望获得更大的市场潜力。
对于生成式AI,ChatGPT的出现让我们对其有了冲击式的关注和理解。因生成式AI功能强大、应用范围广泛,文字、图片、音视频内容相关的从业者在面对“强大助手”上线时,也会感觉到焦虑,恐被其取代。从可能性来讲,它可以进行文字生成语音、图像智能编辑、视频智能剪辑、文字续写或纠错等十分多样的工作,让大家摆脱机械劳动,把时间花在创意性工作上,给文字作者、翻译人员、插画师、视频剪辑师等带来极大的支持。不仅如此,生成式AI还能胜任部分由设计师、程序员甚至专业工程师从事的设计与编程类工作,在提升工作效率的同时让这些专业人士更能发挥所长,减少在初级工作上的时间投入。与此同时,生成式AI对于从业人员的素质和技能,也提出了新的要求。总的来说,决策式AI和生成式AI均可以帮助用户推进部分工作,如事件决策、创作内容等。可以说,人工智能的合理利用有助于提升客户体验,帮助企业降本增效,并抓住新的商业机会。
如前文所述,数据和模型分属人工智能产业的基础层和技术层,无论是决策式AI还是生成式AI的应用都离不开数据和模型,下面我们进一步了解“大数据”和“大模型”是如何重塑人工智能版图的。
从大数据到大模型
无论是决策式AI还是生成式AI,以其现在的功能和潜力,都能为人类做很多工作,未来甚至有点万能,那么这么万能的技术,是怎么被“训练”出来的呢?这就要说到大数据了,决策式AI和生成式AI,其实都离不开用大量数据来训练模型。
对于大数据,大众已经比较熟悉。顾名思义,大数据指的是海量的数据,但大数据并没有看上去这么简单,它还有多样性和高速增长的特性。图1-3展示了从2017年到2025年全球数据总量的增长趋势及预测情况。收集、存储、处理和分析各种形式和来源的大数据,可以帮助企业和组织迅速获得有价值的信息,并做出正确的决策,它还可以用于商业活动的改善,如此能提升工作效率,降低工作成本,并推动企业实现更大的增长。就如人类通过经历各类事件来积累经验一般,在人工智能领域,我们通过大量的数据来训练模型。
图1-3 2017—2025年全球数据总量增长趋势及预测情况
数据来源:国际数据公司发布的白皮书《数据时代2025》
而随着深度学习的落地和发展,模型本身所需的存储空间在近年有了显著增长,最初的GPT就有1.17亿个参数,ChatGPT有1750亿个参数,最新的GPT-4参数数量更多,有报道称可能达到1T(即10 000亿),但OpenAI公司其实并没有公布具体的参数数量,这些拥有海量参数的模型都被称为“大模型”。如图1-4,它展示了大模型参数数量变化趋势。这里我们提到了深度学习,这是一种受人脑的生物神经网络机制启发,并模仿人脑来解释、处理数据的机器学习技术,它能自动对数据进行特征提取、识别、决策和生成。你可能觉得这个词有点耳熟,其实它大规模地应用于自然语言处理(NLP)、计算机视觉、机器翻译等领域。深度学习的出现,为很多领域的工作带来了前所未有的精度和效率。人工智能行业也因深度学习收获了前所未有的发展速度,整个人工智能领域的发展都曾被它带动。
图1-4 大模型参数数量变化趋势
大模型能分析处理海量的数据,在解决问题上取得更好的效果。本书的“主角”生成式AI就是大模型的产物。近年来,大模型在越来越多的行业和消费类应用中崭露头角,原因主要是它能够迅速有效地处理海量的数据,帮助个人和企业提升效率。大模型与人工智能技术相辅相成,随着人工智能技术的发展,大模型也会持续发展进步。另外,生活中日益普及的5G网络和弹性计算等基础设施,也会给大模型的发展创造更多可能性,使其成为不可或缺的内容生成工具。
生成式AI市场格局
2021年,高德纳咨询公司(Gartner)就曾预测,至2023年将有20%的内容被生成式AI创建,至2025年生成式AI产生的数据将占所有数据的10%(2021年不到1%)。2022年9月,红杉资本官网发布的文章《生成式AI:充满创造力的新世界》预测,生成式AI将产生数万亿美元的经济价值。据预测,2025年,国内生成式AI应用规模有望突破2000亿元,国内传媒领域应用空间超1000亿元。而且,生成式AI“八面玲珑”,它的应用场景十分广泛,目前不仅应用于文本、图片、音视频、游戏等数字媒体,还可以应用于制造业、建筑业等实体行业。
在文本生成方面,生成式AI可以通过语言模型、神经网络和深度学习技术,快速创建大量有助于改善客户体验的内容,如新闻资讯、剧本、营销文本、智能客服等。其中作为经典应用的AI生成营销文本、智能客服等都已在许多行业广泛地应用;AI生成新闻资讯和剧本等功能大家也可以期待一下,或许以后结合了ChatGPT等突破性的模型,文字性工作真的能依靠它变得轻松不少。
在图片生成方面,生成式AI可以通过计算机视觉来分析图片,生成营销素材、设计方案和艺术作品等,帮助节省人力成本和时间。另外,生成式AI还能在音频生成、视频生成和跨模态生成领域大展拳脚。
在音频生成方面,生成式AI可以帮助使用者更好地分析、编辑和生成音频文件,从而帮助创作出优秀的音频作品。例如,克隆真人的语音、文本生成特定语音、作曲编曲等,生成式AI都能代替人类去做,并均已经广泛应用于市场。
视频生成也是生成式AI的重要应用,它可以帮助使用者生成高质量的视频,如检测和删除特定片段、跟踪剪辑、生成特效、合成视频等。另外,大火的AI数字人也是它的“拿手绝活”。在李安执导的《双子杀手》中,工作人员就用AI创造了一个数字人物小克。威尔·史密斯在数字技术的帮助下同时出演了50岁特工亨利和23岁特工小克,该片实现了真实明星“年轻版”的数字化制作。
在跨模态生成中,生成式AI能够根据文字生成创意图片、根据图片生成视频、根据文字生成视频,或根据图片或视频生成文字。对想象力丰富的朋友,或者影视行业从业者来说,这称得上是“工作神器”。图1-5就是一个根据文字“panda in a space suit”(穿着宇航服的熊猫)生成图片的例子。在游戏方面,生成式AI可以用于游戏开发,实现自动化的游戏设计,同时能够实现更好的游戏体验,如人工智能NPC(非玩家控制角色)等,说不定以后你玩的游戏就有人工智能的深度参与。
图1-5 根据“panda in a space suit”生成的图片
生成式AI不光在这些数字经济领域广泛应用,在实体领域的潜力也非常大,如在建筑业等巨型垂直实体领域中,生成式AI所生成内容就不再仅局限于图片和文字,而是进入了信息形式更为丰富的3D(三维)设计领域。例如构建数字建筑模型时,生成式AI能帮助建筑师们产出3D建筑模型,让他们更好地理解项目。建筑师们能够使用AI图像生成应用来丰富建筑设计方案的细节,假如建筑师们向应用中输入较为初级的建筑设计方案,AI就能够在初级设计的基础上,继续产出较为细化的设计方案,以此来深化设计。建筑师们还可以随手绘制一个潦草的建筑场景线图,让人工智能来生成对应的建筑实景图。我们可以想象,随着手绘信息的增加,生成式AI输出的实景图也越来越稳定。图1-6所示的就是利用AI图像生成工具生成的建筑设计图。
图1-6 由AI图像生成工具生成的建筑设计图
图片来源:https://stability.ai/blog/stablediffusion2-1-release7-dec-2022
技术的浪潮层叠翻涌,人工智能已成为人类社会冲向未来世界的战舰,产业前景十分广阔。生成式AI更是一个突破性的产业发展方向,它不仅能给数字媒体和虚拟空间带来价值,还能促进实体行业的发展,在提升行业效率的同时优化原有的流程,创造出新的价值增长点,可以说是实体行业升级不可多得的机遇。