百度,它真的,我哭死。
上周四,顶着OpenAI和Bing Chat的压力,百度正式发布了文心一言。
虽然勇气可嘉,但效果差强人意。
一方面,这场造势已久的发布会竟然是提前录屏。
另一方面,文心一言也正如李彦宏本人所描述的那样:没那么完美。
这段时间,随着网友们的疯狂涌入,文心一言也几乎承包了科技圈里的所有笑点。
在发布会中,李彦宏亲自展示了文心一言生成文本、图片、音频、视频等功能。
但网友的实际测试下来后,却大受震撼。
胸有成竹的男人:
虎头虎脑的大胖小子:
青梅竹马的情侣:
武松打虎:
熊熊烈火:
红烧狮子头:
鱼香肉丝:
夫妻肺片:
车水马龙:
文心一言对于中文的理解水平,很容易让人联想到当初怎么也画不好筷子和手指的Stable Diffusion。
那么,作为最大中文搜索引擎出身的百度,怎么Ai连最传统的菜品和成语都无法正确识别呢?
有不少网友提出了质疑。
在2022年8月,百度就曾发布过一款图片生成工具——文心一格。
而在对比了结果图后,有人认为,文心一言的作图功能直接调用的文心一格。
另一边,微博博主 @刘大可先生 也发帖称,“文心一言”Ai绘画功能有套壳、造假的嫌疑。
据其所述,文心一言疑似把用户输入的中文先翻译成英文,然后使用Stable Diffusion生成图画后,再回传给用户。
例如,输入关键词“医生”或“博士”后,文心一言只会根据“doctor”绘出医生的人物。
比如,输入“鼠标”后,文心一言会给出“mouse”的老鼠图片。
比如,生成一幅“总线”和“狗”的图片,而总线在英文里的翻译是“BUS”,最终文心一言给出了“大巴车”的结果。
也就是说,文心一言其实是将中文翻译成英文来进行理解的。
百度明明掌握着大量的中文数据,却无法复现到其AI产品中,是不是有点说不过去呢?
当然,就算文心一言使用了英文标注的数据,也不能证明它就是套壳。
舆论愈演愈烈,很快,百度官方也就文心一言文生图功能作出了回应。
百度表示,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。
而对于大模型的训练使用的是是全球互联网公开数据,符合行业惯例。
最后其表示:大家能从接下来文生图能力的快速调优迭代,看到百度的自研实力。
一位业内人士指出,文心一言主要还是中文训练数据不足的问题,目前开源的图文数据大部分是英文的。
由于发布时间仓促,百度对于画图AI的中文输入词还没完全搞定,才采用了这样的方法来过度。
现在,距离文心一言正式发布已经过去一个星期,也许在未来的一段时间,“不完美”依旧是文心一言的主旋律。
文心一言确实不如ChatGPT,毕竟从客观上来说,ChatGPT或者GPT-4语言模型,花费了5年时间、经历了4次迭代,才完成了从量变到质变过程。
想让文心一言在短时间内实现赶超,几乎是不可能的事情。
你看好文心一言吗?
温馨提示
关注【宝藏姬】
阅读更多精彩内容