怕什么?会画画的AI就是个老乙方

AI(人工智能)太会画画了,碾压人类拿奖的那种,艺术家和创意工作者们瑟瑟发抖。但如果真这么想,不是高估了AI能力,就是太不把自己当回事了。

文 / Cindy

近期,一幅名为《空间歌剧院》(Théâtre D'opéra Spatial)的AI画作,在美国科罗拉多州博览会艺术比赛的数字类别中夺得大奖。作者Jason Allen是一位39岁的游戏设计师,他在创作中主要使用了AI绘画工具Midjourney。

看来,AI在画画这件事上打败人类的一天终于还是来了。“AI画作拿一等奖惹怒人类艺术家”的话题一时间冲上微博热搜。

不过,尽管AI得奖的事在网上引发轩然大波,不少人也对这一比赛结果表示不服,主办方还是照常颁了奖。

“我们眼睁睁看着艺术在眼前消亡。如果创意类工作有被机器取代的危险,那么其他技术含量更高的工作也一样。”一位网友在Twitter上悲伤绝望地评论道。

咦,AI又双叒叕来抢人类的饭碗了? 有这么惨吗?

会画画的AI是个老乙方

先来看看《空间歌剧院》是怎么靠AI画出来的。

Jason Allen创作这幅画时,先多次调整输入的提示词,用Midjourney生成上百幅画作;再经过数周的修改和挑选,包括Photoshop调整润色,选出3幅最满意的作品;最后,用Gigapixel AI升级画质,放大打印在画布上。

也就是说,创作者只要在AI绘画工具Midjourney输入想到的文字,就能通过人工智能生成相对应的图片,耗时只有大约一分钟。

这不就是“我写你画”的游戏吗?

所以说,不要神化AI画画,这里并没有一个长得像艺术家一样的机器人,坐在画布前刷刷几笔完爆人类。

AI画画靠的是“文字转图片”功能。人类甲方只要给AI下达一个文字brief,就能在短时间内获得AI乙方的多版图片设计。

这个人工智能创新方向可吸引了不少玩家加入。

在大大小小研究“根据文字描述生成图片”模型的科技公司中,除了Midjourney,比较知名的项目还有OpenAI 的 DALL·E,谷歌的 Imagen,Stability AI,以及DALL·E 的“高仿品”Craiyon(原DALL·E mini)。

以最知名的DALL·E(达利)为例,它由人工智能实验室OpenAI研发,如今已经有了第二代DALL·E2。据说名字的由来,是为了致敬2008年动画电影《机器人瓦力》和超现实主义画家萨尔瓦多·达利。

我们暂且称DALL·E模型为“达利”,它会画画的原理是什么呢?

举个例子,当你在达利搜索栏输入“长得像牛油果的茶壶”,它会在大约5秒时间内,生成多达10张与“牛油果茶壶”词义相符的图片。

达利的功能“outpainting”,甚至可以扩充原来的画布,把《戴珍珠耳环的少女》变成一幅人与背景自然融合的画作。

这其中的原理是,与很多人工智能算法模型一样,达利是一个模拟了大脑神经元网络的数学系统,它通过分析大量数据来学习技能。比如在识别出一颗牛油果之前,达利至少观摩了上千个大大小小、奇形怪状的牛油果。

而更重要的是,它还需要在图像与描述图像的文字之间,找到一种关系模式。

“虽然这些被制作的图像既超现实又呈现卡通化,但它们证明了,人工智能已经学会‘世界被组合在一起的基础逻辑’。” 《MIT技术评论》对达利如此评价。

以此类推,如果打开脑洞输入更有想象力、更复杂的文字描述,则会得到更多意想不到的画作。

会下棋的猫

一个雨夜,一个超级英雄栖息在城市上空,风格就像一本漫画书

位于城市中心的巴比伦空中花园,达利画风

骑着马的宇航员

熊猫宝宝在银河尽头弹钢琴

不过,如果细心观察猫咪和宇航员就会发现,达利在描绘“手脚”等细节上仍然略显不足,还有进步的空间。

在OpenAI 的Instagram上,还有更多AI“艺术家”的大作,看完一整个就是震惊了。

其实无论是哪款模型,AI作画的逻辑大同小异。尽管有人觉得艺术大赛获奖的AI画作有“作弊”嫌疑,但除了AI作画,作者还需要不断修改影响灯光、视角、构图、氛围、主题画作显示效果的关键词语,才能最终得到相对满意的结果。

显然,这个过程不是靠AI独立完成的,每一张AI作品,其实都是人类与AI的完美搭档之作。

人类才是AI的老甲方

AI画画并不是新鲜事了,但是它的技艺日渐精湛,已经不是一个噱头这么简单。所以说,与其对技术感到惊叹或恐惧,都不如想想怎么早点下手,让它给人类打工。

传媒巨头赫斯特旗下时尚杂志《COSMO》,就在设计6月刊封面时,选择与AI“灵魂画手”DALL·E 2(达利二代)共同合作。

《COSMO》的编辑决定邀请OpenAI试水传媒行业,而且一出手就玩大的,请AI设计对杂志来说有着举足轻重意义的整版封面。

DALL·E 2相比人类设计师工作效率奇高,每次仅需20秒,就可以将输入的文字生成相应的图片,而且一下就是6版。

不过这一过程仍需人类的参与,6位杂志人员不断打磨和迭代输入的文本,最终采用的brief是:

从下往上的广角拍摄,一个有着健美女性身材的女性宇航员,在火星上和无限的宇宙背景中大摇大摆地走向相机,采用合成波风格(synthwave)。

之后,杂志利用DALL·E 2 “outpainting”功能,根据初始生成的图片,不断在边缘处补足、润色画面,使之顺畅自然,最后生成一张由AI创作的较为满意的杂志封面。

同样的AI绘画工具DALL·E 2,在涉足传媒领域后,也在营销广告界大展身手。

亨氏(HEINZ)品牌的创意就有点凡尔赛了,它在DALL·E 2输入各种包含“蕃茄酱”的文字,比如“文艺复兴番茄酱”“番茄酱瓶的印象派绘画”,结果无一例外,AI的画作结果中出现的都是亨氏品牌。

与此同时,亨氏还邀请世界各地的番茄酱爱好者,参与到AI画番茄酱的活动中来,通过在DALL·E 2输入他们想要的文字描述,得到充满创意的AI作品,再将其分享在社交媒体上。

通过这波操作,亨氏借AI之手来验证“番茄酱等于亨氏”理论,即无论在世界哪个角落,当人们谈起番茄酱时,想到的一定是亨氏,从而强化品牌与产品的联系,加深消费者对品牌的认知。

DALL·E 项目产品经理 Joanne Jang 曾表示,OpenAI 最终肯定还是希望能将 DALL·E 2 商业化的,但希望在艺术生成的这个方向上,把它做成一个创作者的工具,而不是替代品。

言外之意是,AI不会抢人类的饭碗,而是成为乙方好好打工。

参与了《COSMO》封面项目的数字艺术家 Karen Cheng 也认为:“创意将会迎来一次爆发,新的工种也将被创造出来,那种可能性是今天的我们所无法想象的。”

而Midjourney的创始人David Holz接受科技媒体The Verge专访时,则用了更为精妙的比喻,他把AI比作水,来回答如何面对AI绘画工具可能对人类构成的威胁。

“水是危险的,但你也可以在里面游泳、制造船只、用水坝发电。水是危险的,但它也是文明的驱动力,作为知道如何与水一起生活和共事的人,我们相处得更好。这是一个机会。水没有意志、没有恶意,你可能淹死在里面,但这并不意味着我们应该禁止水。当你发现一个新的水源时,这真的是一件好事。”

AI绘画工具的存在,不应只让人感到被取代的恐惧。在某种程度上,AI作为工具可以扩大人类的想象力。就像汽车比人的速度快,但并不意味着我们不再行走。“我们认为这项技术是想象力的发动机。”David Holz说。


主要参考文章:

《危险算法“达利”,开启“图片造假”新高度》,虎嗅

《新一代梗图之王,居然是它》,硅星人

‘An engine for the imagination’: the rise of AI image generators,The Verge

是个   AI
发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章