服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

百度文心一言发布,硬刚 ChatGPT!

日期: 来源:架构之路收集编辑:点击关注 

点击关注公众号,架构干货及时送达

来源:OSC开源社区

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。今天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。

发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

文心一言,能做什么?
文心一言作为国内几个大厂中诞生出的首个生成式 AI 产品,到底能实现什么样的功能呢?百度 CEO 李彦宏也没有藏着掖着,在发布会一开始就展现了文心一言的 5 个使用场景,并且针对这些使用场景一一进行了功能展示。
  • 文学创作;

  • 商业文案的创作;

  • 数理逻辑的推算;

  • 中文的理解;

  • 多模态生成;

目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?
场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。
场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。
场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。
场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。
场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。

与 Bing Chat 和 ChatGPT 的对比

相比 ChatGPT 和 Bing Chat,“文心一言” 最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。
图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。
演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。
下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。
首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。
Bing Chat 的回答还显示其信息来源是百度百科。 
而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。
在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。
而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。
虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。
可以看到,Bing Chat 的解读像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。
来到中文理解方面,文心一言的优势就体现出来了。
在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为询问的是唐代的物价,因此返回的信息是洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。
而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。
相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。
由此可见,文心一言在中文领域的表现确实要优于 ChatGPT、Bing Chat。不过,李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

技术架构 & 特性

百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。
百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用;文心一言则位于模型层。
王海峰表示,文心一言能迅速推出主要是基于百度十一年来的积累,且四层之间形成了层到层的反馈、端到端的优化。尤其是框架层的飞桨和模型层的文心大模型之间的协同优化,在开发文心一言的过程中起到了至关重要的作用。
根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。
文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。
体验途径
百度已公布文心一言的邀请测试方案。
3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。
企业客户则可以使用百度智能云开放的「文心一言」 API 接口
(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ),尚未获取 API 的企业可在百度智能云平台进行预约。

最后附上一张梗图:


END



最近好文


1、史上最全架构师知识图谱(纯干货)

2、打造一个 API 快速开发平台,牛逼!

3、图解分库分表,写的太好了!

4、技术总监需要会些什么?也太难了!

5、监控界的最强王者,没有之一!




——更多架构干货请关注公众号架构之路——


好文!点个在看吧!

相关阅读

  • 史上最大规模降价!5月7日生效!

  • 4月26日,阿里云宣布启动史上最大规模降价,核心产品价格全线下调15%-50%,存储产品最高降50%。阿里巴巴董事会主席张勇26日还透露,已有20万企业用户申请接入阿里版ChatGPT“通义千问
  • 科大讯飞申请注册“星火大模型”商标

  • 科技边角料获悉科大讯飞股份有限公司日前申请注册多个“讯飞星火大模型”“讯飞星火认知大模型”“Spark Desk”“星火”等商标,国际分类涉及广告销售、科学仪器、教育娱乐等
  • 开启 AIGC 时代的那个人,一分钱都没赚到

  • 2021 年的时候,一位基金经理在 Discord 上找到了人在德国的高中老师克里斯托夫·舒曼。基金经理愿意承担舒曼开源项目的所有云计算成本,没有任何附加条件。一开始舒曼不敢相信
  • 满满干货,最新商品卡运营攻略来啦!

  • 抖音电商商品卡免佣政策落地近两月,利好政策扶持下海量商家入局商品卡经营,并获得丰厚佣金。为助力商家们更好掌握商品卡运营技巧,快速打开生意新局面,平台现推出更全面、更清晰
  • 训练自己的 ChatGPT,真香!

  • 关注 AI 实战,开启智能生活!推荐阅读:用上 ChatGPT 啦,打破你的认知!Spring + OpenAI 生成图像,真香!Spring Boot + ChatGPT 项目实战来了!作者 | Uranushttps://zhuanlan.zhihu.com
  • 复旦版 ChatGPT 正式开源,太强了!!

  • 关注 AI 实战,开启智能生活!推荐阅读:用上 ChatGPT 啦,打破你的认知!Spring + OpenAI 生成图像,真香!Spring Boot + ChatGPT 项目实战来了!来源:机器之心开源版的 Moss 真的来了。项

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四
  • 美国对华2000亿关税清单,到底影响有多大?

  • 1 今天A股大跌,上证最大跌幅超过2%。直接导火索是美国证实计划对华2000亿美元产品加征25%关税。 听起来,2000亿美元数目巨大,我们来算笔账。 2000亿美元,按现在人民币汇率

最新文章

  • PyCharm 2023.1 最新变化 | 版本更新

  • 摘要 PyCharm 2023.1 现已正式发布!今年的第一个主要版本带来了对远程 Jupyter Notebook 的支持、对新 UI 的增强、改进的泛型类型推断等。下载 PyCharm 2023.1新 UI我们在 P
  • 百度文心一言发布,硬刚 ChatGPT!

  • 点击关注公众号,架构干货及时送达来源:OSC开源社区OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。今天下午,文心一言 (ERNIE Bot)—— 百度全新一
  • 苹果发布会官宣!跨时代的产品要来了

  • IT之家的朋友们,大家好,我是雨仔。就在今天清晨,苹果官方宣布,将于北京时间 6 月 6 日至 10 日举办 Apple 全球开发者大会(WWDC 2023)。和前几届的状况相仿,今年 WWDC 大部分将是一
  • 聊一款新上市的主流价位轻薄本

  • IT之家编者寄语:笔吧评测室作为老牌评测媒体,一直都是IT之家编辑们学习笔记本相关知识的必读公众号。十多年前浪歌就在贴吧追猪王的测评了。进入新媒体时代,猪王对笔记本的评测