怕什么？会画画的AI就是个老乙方

科技 09-16 来源： CMaker

AI（人工智能）太会画画了，碾压人类拿奖的那种，艺术家和创意工作者们瑟瑟发抖。但如果真这么想，不是高估了AI能力，就是太不把自己当回事了。

文 / Cindy

近期，一幅名为《空间歌剧院》（Théâtre D'opéra Spatial）的AI画作，在美国科罗拉多州博览会艺术比赛的数字类别中夺得大奖。作者Jason Allen是一位39岁的游戏设计师，他在创作中主要使用了AI绘画工具Midjourney。

看来，AI在画画这件事上打败人类的一天终于还是来了。“AI画作拿一等奖惹怒人类艺术家”的话题一时间冲上微博热搜。

不过，尽管AI得奖的事在网上引发轩然大波，不少人也对这一比赛结果表示不服，主办方还是照常颁了奖。

“我们眼睁睁看着艺术在眼前消亡。如果创意类工作有被机器取代的危险，那么其他技术含量更高的工作也一样。”一位网友在Twitter上悲伤绝望地评论道。

咦，AI又双叒叕来抢人类的饭碗了？有这么惨吗？

会画画的AI是个老乙方

先来看看《空间歌剧院》是怎么靠AI画出来的。

Jason Allen创作这幅画时，先多次调整输入的提示词，用Midjourney生成上百幅画作；再经过数周的修改和挑选，包括Photoshop调整润色，选出3幅最满意的作品；最后，用Gigapixel AI升级画质，放大打印在画布上。

也就是说，创作者只要在AI绘画工具Midjourney输入想到的文字，就能通过人工智能生成相对应的图片，耗时只有大约一分钟。

这不就是“我写你画”的游戏吗？

所以说，不要神化AI画画，这里并没有一个长得像艺术家一样的机器人，坐在画布前刷刷几笔完爆人类。

AI画画靠的是“文字转图片”功能。人类甲方只要给AI下达一个文字brief，就能在短时间内获得AI乙方的多版图片设计。

这个人工智能创新方向可吸引了不少玩家加入。

在大大小小研究“根据文字描述生成图片”模型的科技公司中，除了Midjourney，比较知名的项目还有OpenAI 的 DALL·E，谷歌的 Imagen，Stability AI，以及DALL·E 的“高仿品”Craiyon（原DALL·E mini）。

以最知名的DALL·E（达利）为例，它由人工智能实验室OpenAI研发，如今已经有了第二代DALL·E2。据说名字的由来，是为了致敬2008年动画电影《机器人瓦力》和超现实主义画家萨尔瓦多·达利。

我们暂且称DALL·E模型为“达利”，它会画画的原理是什么呢？

举个例子，当你在达利搜索栏输入“长得像牛油果的茶壶”，它会在大约5秒时间内，生成多达10张与“牛油果茶壶”词义相符的图片。

达利的功能“outpainting”，甚至可以扩充原来的画布，把《戴珍珠耳环的少女》变成一幅人与背景自然融合的画作。

这其中的原理是，与很多人工智能算法模型一样，达利是一个模拟了大脑神经元网络的数学系统，它通过分析大量数据来学习技能。比如在识别出一颗牛油果之前，达利至少观摩了上千个大大小小、奇形怪状的牛油果。

而更重要的是，它还需要在图像与描述图像的文字之间，找到一种关系模式。

“虽然这些被制作的图像既超现实又呈现卡通化，但它们证明了，人工智能已经学会‘世界被组合在一起的基础逻辑’。” 《MIT技术评论》对达利如此评价。

以此类推，如果打开脑洞输入更有想象力、更复杂的文字描述，则会得到更多意想不到的画作。

会下棋的猫

一个雨夜，一个超级英雄栖息在城市上空，风格就像一本漫画书

位于城市中心的巴比伦空中花园，达利画风

骑着马的宇航员

熊猫宝宝在银河尽头弹钢琴

不过，如果细心观察猫咪和宇航员就会发现，达利在描绘“手脚”等细节上仍然略显不足，还有进步的空间。

在OpenAI 的Instagram上，还有更多AI“艺术家”的大作，看完一整个就是震惊了。

其实无论是哪款模型，AI作画的逻辑大同小异。尽管有人觉得艺术大赛获奖的AI画作有“作弊”嫌疑，但除了AI作画，作者还需要不断修改影响灯光、视角、构图、氛围、主题画作显示效果的关键词语，才能最终得到相对满意的结果。

显然，这个过程不是靠AI独立完成的，每一张AI作品，其实都是人类与AI的完美搭档之作。

人类才是AI的老甲方

AI画画并不是新鲜事了，但是它的技艺日渐精湛，已经不是一个噱头这么简单。所以说，与其对技术感到惊叹或恐惧，都不如想想怎么早点下手，让它给人类打工。

传媒巨头赫斯特旗下时尚杂志《COSMO》，就在设计6月刊封面时，选择与AI“灵魂画手”DALL·E 2（达利二代）共同合作。

《COSMO》的编辑决定邀请OpenAI试水传媒行业，而且一出手就玩大的，请AI设计对杂志来说有着举足轻重意义的整版封面。

DALL·E 2相比人类设计师工作效率奇高，每次仅需20秒，就可以将输入的文字生成相应的图片，而且一下就是6版。

不过这一过程仍需人类的参与，6位杂志人员不断打磨和迭代输入的文本，最终采用的brief是：

从下往上的广角拍摄，一个有着健美女性身材的女性宇航员，在火星上和无限的宇宙背景中大摇大摆地走向相机，采用合成波风格（synthwave）。

之后，杂志利用DALL·E 2 “outpainting”功能，根据初始生成的图片，不断在边缘处补足、润色画面，使之顺畅自然，最后生成一张由AI创作的较为满意的杂志封面。

同样的AI绘画工具DALL·E 2，在涉足传媒领域后，也在营销广告界大展身手。

亨氏（HEINZ）品牌的创意就有点凡尔赛了，它在DALL·E 2输入各种包含“蕃茄酱”的文字，比如“文艺复兴番茄酱”“番茄酱瓶的印象派绘画”，结果无一例外，AI的画作结果中出现的都是亨氏品牌。

与此同时，亨氏还邀请世界各地的番茄酱爱好者，参与到AI画番茄酱的活动中来，通过在DALL·E 2输入他们想要的文字描述，得到充满创意的AI作品，再将其分享在社交媒体上。

通过这波操作，亨氏借AI之手来验证“番茄酱等于亨氏”理论，即无论在世界哪个角落，当人们谈起番茄酱时，想到的一定是亨氏，从而强化品牌与产品的联系，加深消费者对品牌的认知。

DALL·E 项目产品经理 Joanne Jang 曾表示，OpenAI 最终肯定还是希望能将 DALL·E 2 商业化的，但希望在艺术生成的这个方向上，把它做成一个创作者的工具，而不是替代品。

言外之意是，AI不会抢人类的饭碗，而是成为乙方好好打工。

参与了《COSMO》封面项目的数字艺术家 Karen Cheng 也认为：“创意将会迎来一次爆发，新的工种也将被创造出来，那种可能性是今天的我们所无法想象的。”

而Midjourney的创始人David Holz接受科技媒体The Verge专访时，则用了更为精妙的比喻，他把AI比作水，来回答如何面对AI绘画工具可能对人类构成的威胁。

“水是危险的，但你也可以在里面游泳、制造船只、用水坝发电。水是危险的，但它也是文明的驱动力，作为知道如何与水一起生活和共事的人，我们相处得更好。这是一个机会。水没有意志、没有恶意，你可能淹死在里面，但这并不意味着我们应该禁止水。当你发现一个新的水源时，这真的是一件好事。”

AI绘画工具的存在，不应只让人感到被取代的恐惧。在某种程度上，AI作为工具可以扩大人类的想象力。就像汽车比人的速度快，但并不意味着我们不再行走。“我们认为这项技术是想象力的发动机。”David Holz说。

主要参考文章：
《危险算法“达利”，开启“图片造假”新高度》，虎嗅
《新一代梗图之王，居然是它》，硅星人
‘An engine for the imagination’: the rise of AI image generators，The Verge

是个 AI

发表评论

留言与评论（共有 0 条评论） “”

售价13.76万，爆184马力，体验AION Y 2

看了雷军简历，才知道雷军确实是个天

iPhone13 官网降价了，AirPods 推出

一文带你了解javaIO流

老卢真是个戏精，不管你看不看，反正他

AirPods Pro 2首发测评出炉，果粉看

网友投稿普通会员

我还没有学会写个人说明

2129687 篇文章

79254927 次浏览

最近文章

怕什么？会画画的AI就是个老乙方

会画画的AI是个老乙方

人类才是AI的老甲方

相关文章

推荐文章

最热点击文章

热门标签