1.1.3 发展进程回顾
1.早期的尝试
AI绘画在计算机出现后不久就已经开始有了最初的探索。在20世纪70年代时,艺术家Harold Cohen创造了AARON程序,AARON可以操作机械臂进行绘画。Harold对AARON的改进持续了很久,到20世纪80年代的时候,ARRON可以尝试绘制三维物体,并且不久后就可以进行彩图绘画,如图1-7所示。
图1-7 AARON绘画装置
2006年出现了The Painting Fool装置,如图1-8所示,The Painting Fool装置可以通过观察照片提取颜色信息,使用现实中的材料进行创作,完成的画作效果如图1-9所示。AARON程序和The Painting Fool装置都是比较初级的计算机自动绘画。
图1-8 The Painting Fool装置
图1-9 The Painting Fool完成的画作
2.深度学习的初步应用
2012年,Andrew Ng和Jeff Dean进行了一次实验,使用1.6万个CPU和Youtube上一千万张猫脸图片,耗时3天训练出了当时最大的深度学习网络,并生成了一张猫脸图片,如图1-10所示。对当时的计算机视觉领域来说,这是具有突破性意义的尝试,并且正式开启了AI创作的全新方向。
3.使用GAN网络进行AI绘画
2014年,AI学术界提出了一个非常重要的深度学习模型:对抗生成网络(Generative Adverserial Network, GAN)。正如同其名字“对抗生成”,这个深度学习模型的核心理念是让两个神经网络“生成器(generator)”和“判别器(discriminator)”进行激烈的竞争,其中生成器用来生成图片,而判别器用来判断图片质量,平衡之后得到结果。
GAN网络一经问世就风靡AI学术界,在多个领域得到了广泛的应用。它也随即成为了很多AI绘画模型的基础框架,GAN网络的出现大力推动了AI绘画的发展。
4.Diffusion Model和DALL-E的出现
2016年,Diffusion Model模型被提出,并开始受到广泛的关注。它的原理跟GAN完全不一样。Diffusion Model模型使用随机扩散过程来生成图像,从而避免了GAN模型中图片风格过于相似的问题。
2021年初,OpenAI发布了广受关注的DALL-E系统,该系统基于扩散模型进行训练,图1-11所示是DALL-E画一只狐狸的结果。
图1-10 首次使用深度学习进行绘画
图1-11 DALL-E画作
5.Disco Diffusion V5的发布
2022年的2月,由Somnai等几个开源社区的工程师联合制作了一款基于扩散模型的AI绘图生成器—Disco Diffusion。从此,AI绘画进入了发展的快车道。Disco Diffusion相比传统的AI模型更加易用,并且研究人员建立了完善的帮助文档和社群,越来越多的人开始使用Disco Diffusion创作作品。但是它生成的画面都十分的抽象,几乎无法生成具象的人,这是一个致命的缺点。图1-12所示是Disco Diffusion绘制的一些作品。
图1-12 Disco Diffusion绘画作品
6.Midjourney的发布
2022年3月,一款由Disco Diffusion的核心开发者参与建设的AI生成器Midjourney正式发布。Midjourney搭载在discord平台,借助discord聊天式的人机交互方式,不需要之前烦琐的操作,也没有十分复杂的参数调节,用户只需要向聊天窗口输入文字就可以生成图像。更关键的是,Midjourney生成的图片效果非常惊艳,如图1-13所示。
图1-13 Midjourney-1作品
7.DALL-E2的发布
2022年4月10日,OpenAI发布了DALL-E2。无论是Disco Diffusion还是Midjourney,仔细品味还是可以看出是AI生成的,但DALL-E2的生成图质量已经相当高了,基本无法跟人类的作品进行区分,如图1-14所示。
图1-14 DALL-E2作品
8.Stable Diffusion的发布
2022年7月,一款叫作Stable Diffusion的AI生成器开始内测,人们发现用它生成的AI绘画作品,质量可以媲美DALL-E2,而且还没有那么多限制。Stable Diffusion共邀请了15000名用户参与了内测,仅仅十天后,每天就有一千七百万张图片通过它生成。图1-15所示是Stable Diffusion1.X绘制的一些作品。
图1-15 Stable Diffusion1.X作品
Stable Diffusion内测不到1个月,就正式宣布开源,意味着所有人都能在本地部署Stable Diffusion,这迅速成为大家关注的焦点,人们将它跟各种各样的工具结合,例如有人将Stable Diffusion的绘图能力做成了Photoshop插件,只需要画个草图,之后就能直接生成设计稿。
2022年8月,美国科罗拉多州博览会的艺术比赛评选出了结果,一张名为《太空歌剧院》(如图1-16所示)的画作获得了第一名,但它并不是人类画师的作品,而是一个叫作Midjourney的人工智能的画作。参赛者公布这是一张AI绘画作品时,引发了很多人类画师的愤怒和焦虑。
图1-16 AI获奖作品《太空歌剧院》