著名科幻小说作者刘慈欣早期有一部短篇小说叫《诗云》。讲述的是一个远超地球科技的神级文明在观测地球后,为李白诗中丰富的含义所折服。神级文明能够随意改变太阳的颜色,也能克隆一个一模一样的李白出来,但是却没办法得到一句像李白的诗那样优美的文字。于是,神级文明穷举了所有汉字的排列组合,在太阳系中形成了一片诗云。可是,尽管神级文明得到了比李白写得更好的诗,他们也无法从诗云中检索出来。
现在我们已经获得了比肩神级文明的技术,并且已经超越了他们。
你们相信吗?
刘慈欣《诗云》
图源:百度百科
什么是AI绘画?
打开网站,输入几段描述性的文字,按下回车键,不到一分钟,你就能得到一张高度渲染的精美图像。哪怕你连画笔都没用过,也能“画”出充满艺术气息的画作。如果你再输入几组词语,你还能得到二次元画风的萌妹、写意的中国山水、赛博朋克风的都市。这不是科幻电影中的桥段,而是如假包换的现实。
部分利用AI绘画产生的画作
图源:豆瓣
2022年可以被称为AI绘画元年,AI绘画工具迎来了飞跃性的发展,在几分钟甚至几秒钟内就能产生精美的画作。 AI绘画正以强有力的姿态进入到我们的日常生活中,每个人都可以通过简单的方式得到自己的作品,这让传统绘画行业的画师们感到焦虑。
在AI攻破围棋后,曾经被认为是AI无法涉足的文学艺术领域,最终也沦陷了。一时间,关于AI绘画的讨论不绝于耳。有人认为这代表着艺术的死亡,也有人坚持认为AI绘画终究无法取代人类。
与此同时,也有人利用AI绘画生产出具有色情、暴力性质的图片。面对飞速发展的AI绘画,如何保护画师的利益?如何防止它侵犯他人权益?对于这些问题,我们显然没有做好充足的准备。
萌芽到成熟
AI绘画技术的发展是呈井喷状的,从开始萌芽到基本成熟,前后仅用了几年的时间。
在此之前,AI绘画一直在缓慢进步着,2018年,由法国艺术团队Obvious创作的AI画作《爱德蒙·贝拉米肖像》以43.25万美元售出。该画作利用的是需要较强编程功底的GAN算法,因而得到了高完成度的画作。
《爱德蒙·贝拉米肖像》
图源:微信公众号“中国新闻周刊”
但在当时,大多数人工智能图片工具还只停留在输入参数、生成图片的阶段,其算法相比GAN算法显得过于简单,因此给出的结果普遍不尽如人意。那时市面上开放给大众的AI绘画网站,其本质上更类似于风格转换,即给画作提供一个滤镜,如生成莫奈风格的巴黎圣母院、梵高风格的自由女神像等。同时,这时的AI更擅长于表达抽象的东西,例如梦境,但对具象的东西很难进行完美呈现,比如合乎比例的房子,或者是五官协调的人像。
但在今年4月,随着基于谷歌框架的AI绘画程序Disco Diffusion突然走红,这些问题迎刃而解。虽然,Disco Diffusion的操作界面对没有编程经验的人来说相当不友好,用户在使用时往往会一头雾水。但按照网友的指示在正确的位置输入参数,点击运行,几十分钟后,机器就能依照指令完美地生成你想要的图像。
Disco Diffusion一经发布,便引起业内人士的广泛关注,虽然生成的图片仍存在一些问题,但这项技术带给影视、游戏、绘画行业的冲击已有目共睹。于是,随后的三四个月各大公司纷纷下场,谷歌发布了Imagen和Parti,Facebook发布了Make-A-Scene,一家初创公司发布了Midjourney……在中国,百度也上线了中文版的AI绘画工具——“文心·一格”。
而这些巨头的AI绘画技术之战因Stable Diffusion(下称SD)的发布告一段落。今年8月,SD一经发布,就吸引了全球开发者的关注。不只是因为SD出色的能力和59亿张图像的数据库,更在其选择开源这一关键做法。全球的技术开发者得以在SD的平台上进行二次开发,衍生出各种各样的工具。例如,开源第一周,基于SD模型的Photoshop插件就出现了,这一举动轻松地把Photoshop带入AI绘画时代。
同样在8月,由AI生成的画作《空间歌剧院》在美国科罗拉多州博览会的数字艺术类美术比赛中获得第一名。该画作由一位名叫杰森·艾伦的参赛者利用Midjourney制作,并且一开始他就署名“杰森·艾伦利用Midjourney制作”,没有违反比赛规则。虽然比赛评委一开始并没有正确理解该画作由AI所作,但在知晓原委后表示,即使已经知道是AI所作,也不会改变自己的决定。该奖项的颁布首次大规模掀起了关于AI绘画是否会取代人类的讨论,将AI绘画的争议由网络蔓延到现实中。
《空间歌剧院》
图源:微信公众号“南方周末”
画师真的要失业了吗?
一百多年来,绘画艺术不断经受着新技术的威胁。摄影术曾经给美术带来过最严重的恐慌,乃至造成了画像师行业的凋亡,Photoshop等制图软件又将绘画从纸笔带入到了数位板时代。
这一次,AI绘画的冲击同样会迫使绘画艺术进行思考——曾经被认为是AI无法涉足的艺术领域,最终也被AI攻破。并且,对一些职业产生了巨大的冲击。游戏制图、工业设计、影视美术……这些行业中的人员是否会被AI取代?
为了弄清楚这个问题,我们或许要从AI绘画的原理说起。
AI绘画的原理更接近于人类学习,一个人学习画画是要通过临摹开始,机器也是这样,但它比人做得更快,能够在相同时间内学习更多的画作。据Stable Diffusion的所有人mad所说,其旗下的AI绘画工具学习了100个T的图片,最终生成了4G左右的模型。
既然AI具有如此强大的学习量,那么它最终会取代所以人类画师吗?
最近,画师老累和禾野在微博的骂战可谓是争议两派的缩影。老累在微博中表示AI将取代低端的画家,而禾野认为画师不能被分作低端与高端。两人作为绘圈的两位重量级人物,他们的骂战一度被引爆上了热搜。
自然画师没有低级与高级之分,但对于一些重复性高的、有明确步骤的创作来说,与其说是AI取代了人,不如说是在资本的参与下,这种创作本身被一种成本更加低廉的方式所取代。
正如人们的普遍看法,就连分层这种基础操作,AI也无法完成,而对于一些明确的创作需求,AI绘画也并不能百分之百地完成规定动作。具体来说,对于满分是一百分的要求,AI绘画能够处理八十分的内容,剩下的二十分仍旧需要画师来进行修正。
另外,越精深的绘画创作,越考验的是构图、设计语言、视觉情绪这些比较高级的视觉逻辑。所以,只有具有较高视觉能力的画师才能调教出高水平的AI绘画作品。换言之,即使有了AI绘画的出现,也并非人人都能成为画家。
AI绘画,潘多拉的魔盒?
版权问题和色情暴力作品是有关AI绘画的另一个争议“重灾区”。
对于AI绘画模仿自己的作品,许多艺术家对此表示抗议与愤懑,但AI开发者正不断地迭代系统,根本无暇顾及。
2022年8月29日,AI绘画网站mimic的测试版上线,该网站基于开源算法Stable Diffusion,是针对二次元画风头像的一个网站。该网站上线第一天,就遭到一大批漫画家集体声讨,要求开发者禁止AI模仿自己,部分画家甚至通过删除自己在推特上的画作,来保护自己的合法权益。
日本AI绘画网站mimic及画师的禁止使用声明
图源:腾讯新闻
由于AI绘画的原理与人类学习相近,而学习行为是不违法的,所以很难界定AI绘画是否侵犯了他人版权。目前来说,AI绘画的版权问题依旧是个灰色地带,暂时没有相关的法律保护被AI学习的画师的权益。我们只能期待日后会有相关法律出台,例如从数据训练集的来源入手,监管AI绘画的版权问题。
但困难依然存在:首先这类案件很难取证,其次很容易从技术上规避,比如当下各大训练集就明确说明,训练集的来源并不是图片本身,而是指向这些图片的URL链接和描述这些图片的文字,模型在计算完图片与文本的关系后就直接删除了图片。这个方法可以说是在现有法律层面上完美规避了版权的问题。
另外,同样令人担忧的是,AI绘画还出现了一些危险的倾向。一些人利用AI绘画的自由性创造出色情、暴力等令人不适的图片,甚至出现了基于Stable Diffusion模型的色情图片生成网站。对此,Stable Diffusion创始人的回应是,他们运营团队在每次看到相关内容后会将其清理出去,在必要时设置敏感词。但显然,这样的图片每天依然在数以万计的海量增长。
而且,正因为Stable Diffusion选择开源,团队无法对每一条内容进行审查,这也让AI绘画饱受诟病。但开源带来的能够让全世界技术人员共同编辑创作的优势又难以让团队改变其决定。在资本运作下,海量的投资将进一步涌进AI绘画中,在可预见的未来,版权问题和伦理问题不会得到快速有效的解决,新一轮发展将带病前行。
未来指向何处?
从乐观的角度来看,虽然目前部分AI产生的高质量图像也许会让人产生“创作者可能被取代”的想法,但按照发展趋势来看,AI可能会越来越专门化和工具化,最终成为画师手中辅助绘图的强有力的工具。
在未来,也许绘画工程中繁琐的,具有重复性的工作都能交由AI完成,创作者得以有更多的时间去构思想法与创意,再去调整构图、色彩、光影氛围。待完成这些具有创意性的工作后,再由AI去填满画布。从这一点上看,可以说AI绘画是一次工具革命,将传统的画师从画笔与画布中解脱出来。
更重要的是,虽然AI绘画在目前能够产出一些让人惊奇的画作,甚至能够在一定程度上取代一些具有同质化的作品,但艺术工作者在作品中凝结的热爱、幻想、激情以及任何自我意见的主张,才是艺术作品中蕴含的真正灵魂。
参考文章:
《当AI学会画画,画师们该感到害怕吗》南方周末
《当AI开始画画:画师会失业吗?》中国新闻周刊