2.1.2 生成式AI创新世界
不同细分市场的公司会进入特定的问题空间(例如,代码、设计、游戏),而不是试图成为所有人的一切。它们可能会首先深入整合到应用程序中,以发挥和分配,然后尝试用AI原生工作流程取代现有的应用程序。以正确的方式建立这些应用程序来积累用户和数据需要时间,但我们相信最好的应用程序将是持久的,并有机会成为大规模的。Gartner的报告显示,生成式AI使包括制造业、汽车业、航空航天和国防在内的行业能够设计出满足特定目标和约束条件的优化部件,如性能、材料和制造方法。例如,汽车制造商可以使用生成设计来创新,这有助于实现他们使汽车更省油的目标(2)。
生成式AI和其他基础模型正在改变AI游戏,将辅助技术提升到一个新的水平,减少应用开发时间,并为非技术用户带来强大的能力。像ChatGPT和GitHub Copilot,以及为这些系统提供动力的底层AI模型(Stable Diffusion、DALL·E 2、GPT3/4等),正在将技术带入曾经被认为是为人类保留的领域。有了生成式AI,计算机现在可以说是展现了创造力。它们可以根据查询产生原创内容,从它们获取的数据和与用户的互动中汲取营养。它们可以开发博客、绘制包装设计草图、编写计算机代码,甚至对生产错误的原因进行理论分析。
在行业的竞争策略上,由于生成式AI及AIGC的进化都需要与用户建立持续反馈,并越大越好,所以不同的应用必须针对自己的细分市场进行深耕。领先的生成式AI公司需要双轮驱动,通过不懈努力以获得用户参与,从而获取数据,同时持续地优化模型性能。双轮驱动的过程分成三步:
· 拥有卓越的用户参与度。
· 将更多用户参与度转化为更好的模型性能(提示改进、模型微调、用户选择作为标记的训练数据)。
· 利用优秀的模型性能来推动更多的用户增长和参与。
多年以来,微软被视作一家传统软件公司,把它与创新联系起来似乎有点牵强,但该公司对AI的新发现和对该技术的数十亿投入正在改变这种状况。该公司的搜索引擎Bing十多年来被限制在个位数的市场份额后,最近以全新的功能和界面进入了人们的视线,这要归功于新的AI聊天机器人的整合,而微软新的内嵌GPT3/4的浏览器Edge已推向市场,只要登录就可以直接使用,而不需要懂得任何ChatGPT的知识,它甚至会主动提示你是否需要导入Chrome中的各种配置信息。ChatGPT版必应仅发布一个月,其日活用户就突破了1亿,为历史上首次。借助ChatGPT版必应,微软正以惊人的速度赶超“搜索引擎一哥”谷歌,目前赢得了AI推动的搜索引擎竞赛。因此相信微软将继续把GPT4集成到必应之中。而现在,重点已经转向将生成式AI整合到办公室生产力应用程序中了。
行业巨头谷歌已于2023年3月发布了一套即将为其各种工作空间应用程序提供的生成式AI功能,包括Gmail、Docs、Sheet和Slides。仅仅几天后,微软发布了365 Copilot,为其自己的办公生产力应用提供类似的生成式AI功能。到目前为止,这两项新增功能都还没有向公众推出,但已经提供了足够的信息来区分这两者。表2-2列出了谷歌Workspace与微软Office 365 Copilot的异同。
表2-2 谷歌Workspace与微软Office 365 Copilot的异同
资料来源:The Indian Express
为了有效地使用生成式AI,需要人类在过程的开始和结束时参与。首先,人类必须向生成模型输入一个提示,以便让它创造内容。一般来说,创造性的提示会产生创造性的输出。未来“提示工程师”可能会成为一个既定的职业,至少在下一代更聪明的AI出现之前。这个领域已经产生了一本82页的《达利2》图像提示书,以及一个提示市场,在这个市场中,只要花一点钱就可以购买其他用户的提示。这些系统的大多数用户需要尝试几个不同的提示,才能达到预期的效果。然后,一旦一个模型生成了内容,就需要由人对其进行评估和仔细编辑。替代的提示输出可能会被合并到一个单一的文件中。图像生成可能需要大量的操作。杰森·艾伦在Midjourney的帮助下赢得了科罗拉多州的“数字操纵摄影”比赛,他告诉记者,Midjourney花了80多个小时制作了900多个版本的艺术作品,并反复微调了他的提示。然后他用Adobe Photoshop改进了艺术化处理,用另一个AI工具提高了图像质量和清晰度,并在画布上打印了三幅作品。生成式AI模型具有令人难以置信的多样性,它们可以接受诸如图像、较长的文本格式、电邮、社交媒体内容、语音记录、程序代码和结构化数据等内容。它们可以输出新的内容、翻译、对问题的回答、情感分析、总结,甚至视频。
生成式AI正在构建一个创造性的新世界(3)。人类善于分析事物,但机器在某些方面甚至表现得更好。机器可以分析一组数据,并在其中找到模式,用于多种用途,无论是欺诈或垃圾邮件检测、预测快递的ETA,还是预测下一步给你看哪个TikTok视频,它们在这些任务上越来越聪明。这被称为分析性AI或传统AI。人类不仅擅长分析事物,也擅长创造。人类写诗、设计产品、制作游戏和编写代码。直到最近,机器还没有机会在创造性工作方面与人类竞争——它们被归为分析和死记硬背的认知劳动。但是,机器刚刚开始创造有意义和美丽的东西。这一新类别被称为生成型AI,意味着机器正在生成新的东西,而不是分析已经存在的东西。如图2-3所示,Gartner在其2023年新兴技术影响雷达的报告中,列举了AIGC的五个行业的应用案例。
(1)药物设计。2010年的一项研究显示,一种药物从发现到上市的平均成本约为18亿美元,其中药物发现成本约占三分之一,而发现过程达3~6年。生成式AI已经被用来研究各种用途的药物,为制药业提供了减少药物发现的成本和时间的重要机会。
(2)材料设计。生成式AI正在影响着汽车、航空航天、国防、医疗、电子和能源行业,以特定的物理特性为目标组成全新的材料。这个过程被称为逆向设计,它定义了所需的特性,并发现了可能具有这些特性的材料,而不是依靠偶然性来找到拥有这些特性的材料。
(3)芯片设计。生成式AI可以使用强化学习(一种机器学习技术)来优化半导体芯片设计(平面规划)中的元件位置,将产品开发的周期从几周缩短到几小时。
(4)合成数据。生成式AI是创建合成数据的一种方式,这是一类生成的数据,而不是从对真实世界的直接观察中获得的。这确保了用于训练模型的数据的原始来源的隐私。例如,医疗数据可以人为地生成用于研究和分析,而不透露其医疗记录,以确保隐私。
(5)部件。生成式AI使包括制造业、汽车业、航空航天和国防在内的行业能够设计出满足特定目标和约束条件的优化部件,如性能、材料和制造方法。例如,汽车制造商可以使用生成设计来实现汽车更省油的目标。
图2-3 按行业划分的AIGC应用案例
资料来源: Gartner
生成式AI正变得更快、更便宜,而且其产物在某些情况下比人类手工创造的东西更好。每一个需要人类创造原创作品的行业——从社交媒体到游戏、从广告到建筑、从编码到平面设计、从产品设计到法律、从营销到销售——都有可能被重新发明。某些功能可能会被生成式AI完全取代,而其他功能则更有可能从人类和机器之间紧密的迭代创意周期中茁壮成长。生成式AI应该在广泛的终端市场中释放出更好、更快、更便宜的创作。未来生成式AI将创造工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市场容量。市场咨询公司Gartner预测,到2025年,生成式AI将占所有创建的数据的10%,而2022年这一比例还不到1%。