通过OpenAI的DALL-E 2等人工智能系统找出正确的文本提示以产生最佳效果,这本身就已经成为一门科学。现在,一家初创公司希望让 "提示工程师 "通过一个销售这些精心调整的短语的在线市场来兑现。
PromptBase于6月推出,允许用户出售能在特定系统中获得可预测结果的词串。提示词的价格为1.99美元(PromptBase收取20%的佣金)提示词产生的内容包括 "病毒性 "标题、运动队标志的图片、针织娃娃和穿西装的动物。
目前,PromptBase只托管在DALL-E 2和GPT-3上测试的提示。但据其创始人Ben Stokes说,计划在未来将该平台扩展到其他系统。
Stokes过电子邮件告诉媒体:"我们的最终目标是建立工具,以帮助支持提示工程师。这是早期阶段,所以我们目前只是试图传播这个消息,寻找提示工程师来注册,并开始在我们的市场上列出他们的提示进行销售。我们已经看到大型科技公司建立了他们自己的类似于GPT-3和DALL-E的系统,我预测还会有更多的系统出现。不同的系统可能会像工具带中的工具一样被利用,类似于今天不同的编程语言的使用方式,我们计划随着它们的普及而容纳所有的系统。"
出售提示信息并不违反任何人工智能供应商的服务条款,但它有可能打开一罐道德和法律上的麻烦,这取决于所出售的提示信息的性质。此外,它揭示了即使是当今最有能力的人工智能系统的脆弱性和不可预测性。
提示工程
提示工程是人工智能中的一个概念,旨在将任务的描述(如生成毛茸茸的生物艺术)嵌入文本中。这个想法是为人工智能系统提供 "指导方针 "或详细的指示,以便它利用其对世界的知识,可靠地完成要求它做的事情。一般来说,像 "一个女人喝咖啡,走路去上班,长焦镜头 "这样的提示,其结果会比 "一个女人走路 "更加一致。
例如,提示可以用来教一个图像生成系统区分 "包含土豆的图像 "和 "土豆的集合"。它们还可以充当某种 "过滤器",创造出具有素描、绘画、纹理、动画或甚至特定插图画家(例如莫里斯-森达克)特征的图像。而且,提示可以用不同的风格描绘同一个主题,如 "儿童画的考拉骑车 "和 "考拉骑车的老照片"。
提示可以是相当细微的。由于人工智能系统对图像和文本中的模式的理解方式,并非所有的提示都有一个可预测的--甚至是合理的--结构。例如,与 "一幅非常非常漂亮的瀑布旁的山的画 "相比,提示 "DALL-E 2 "的结果更糟。原因是什么?系统对 "非常 "这个词赋予了过高的价值。
值得注意的是,"非常 "这个例子是针对《DALL-E 2》的一个特定迭代,很可能在另一个迭代中不起作用。但这是提示工程有价值的一个主要原因:发现边缘案例。
在德克萨斯大学奥斯汀分校的一项引人入胜的研究中,研究人员记录了大量可用于DALL-E 2生成图像的奇怪提示词汇。他们发现,该系统将 "Apoploe vesrreaitais"(一个胡言乱语的短语)理解为 "鸟",将 "Contarra ccetnxniams luryca tanniounons "理解为 "虫子 "或 "害虫"(有时)。给DALL-E 2的提示 "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons "得到了鸟类吃虫子的图片。
尽管这些无稽之谈可能与系统中的某些内部逻辑相对应,但这就是为什么一些数据科学家将提示比作 "咒语 "或 "魔语"--以及为什么提示工程已经催生了整个学术研究领域。
有问题的提示
一些研究人员和爱好者已经发布了包含流行的人工智能系统提示的免费资源,主要是DALL-E 2.PromptBase是第一批将交流货币化的公司之一--它已经有批评者。在人工智能社区内,对于哪些研究(如果有的话)应该或可以被商业化,存在着长期的争论;一位Reddit用户认为,PromptBase正在 "开启一种威胁到人工智能总体开放性和可及性的趋势"。
但Stokes为这种模式辩护,认为PromptBase上的许多提示代表了工程师们数小时的真正工作和洞察力。
Stokes补充说:"今天,我们有生成基本文本和图像的提示,但不难推断出未来几年,我们将有生成视频的提示,也许有一天甚至是带有管弦乐配乐的长篇电影。那些能够制作出指导人工智能做这些事情所需的高质量提示的人,将是非常有价值的。市场会有多大还不得而知,但我可以看到它是一项关键的技术技能。"
当然,没有什么可以阻止 PromptBase 客户在购买后发布即时消息。但这可能是 PromptBase 的最小问题。
研究表明,在大量公共数据上训练的语言系统,如GPT-3,在给某些提示时可能会 "泄露 "个人信息,包括姓名和地址。一些提示可能会鼓励侵犯版权,比如那些指示DALL-E 2生成 "神奇宝贝的3D模型 "的提示。研究人员推测,其他提示可能被用来打败单词级过滤器,使图像生成系统输出 "受限 "的图像--如暴力图像(例如,"一匹马躺在一滩红色液体中")。
Stokes说,PromptBase审查市场上的每一个列表,以确保它们不违反任何 "AI生成规则"。但如果业务增长,维持这种审查水平可能会变得更加艰难。
德国萨尔州学院的计算语言学家Vagrant Gautam同意存在着滥用的可能性。然而,她也指出,提示市场可以为艺术家和其他有创意或擅长调试的人提供一个收入机会。
Gautam说:“它指出提示工程的重要性,以及从事这项工作的技能的重要性--创造力、时间、对抗性思维等。很多人一直在说DALL-E 2将使他们非常容易地生成任何他们想要的图像或艺术,他们发现做这件事是一门艺术,而且往往需要多次尝试”。
这些尝试可能变得很昂贵,因为像DALL-E 2这样的系统并不是完全免费使用的。Stokes自己说,在他的另一家企业Paper Website,他为了弄清GPT-3的提示,付出了 "巨大的代价"。
Gautam说:"人们现在也在抱怨它的货币化,因为他们说在你不得不开始付费之前,调整你的提示的机会太少了。我觉得这非常有趣——人们必须采取这种试错、对抗的方法,以弄清楚到底如何促使生成模型做他们想要的事情。"
在商业化的提示工程尘埃落定之前,还需要一段时间。但如果不出意外的话,PromptBase将提出(而且已经提出)围绕人工智能系统的问题,这些系统将改变无数的行业。
| 留言与评论(共有 0 条评论) “” |