服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

锚定中国版ChatGPT,百度底气何来

日期: 来源:中国科学报收集编辑:中国科学报
文 | 《中国科学报》 记者 赵广立
过去两个多月,“狂飙”,是ChatGPT的常态。

这个诞生于美国AI研究机构OpenAI的人工智能(AI)聊天机器人,不仅持续霸榜科技头条,更一举成为互联网史上用户增速最快的消费级应用:仅2个月,“日活”破亿。

国内各界持续展开了一场围绕ChatGPT的“话题地震”,关于中国版ChatGPT何时到来的讨论也甚嚣尘上。

在数十家宣称进ChatGPT的企业中,大多数都对打造类ChatGPT产品的表述语焉不详,但有一家例外—— 2月7日,百度官宣即将上线大模型新项目,并定名为“文心一言”(英文名:ERNIE Bot)。

百度“文心”
约定了近期、取好了名字,再加上此前在AI底层技术领域的积累,百度因此也被认为最有希望率先推出中国领先大语言模型的企业。

新项目之约就在目下,不日即可见分晓。在如此短时间内站出来,百度底气何来?
IDC:百度文心大模型处在第一梯队

业界共识是,ChatGPT的能力和表现,离不开大模型的支持。

在此前的相关采访中,中科院自动化研究所研究员王金桥告诉《中国科学报》,ChatGPT背后主要基于三大技术突破,首要得益于大规模预训练语言模型GPT3.5的支持,其后才依次是多任务实现统一编码、人类反馈的强化学习(RLHF)。

也就是说,大模型是生成式AI产品的底座,其上才是基于技术和工程的高效实现。更直白一点,假如没有OpenAI对大模型的长期投入,就不会诞生ChatGPT这样的应用。

百度“恰好”拥有深厚的大模型积淀。近日,国际权威咨询机构IDC发布《2022中国大模型发展白皮书》,提出了行业首个大模型评估框架。该框架基于模型能力、工具平台能力等6个维度的11项指标,评估各厂商大模型的水平。

IDC评估结果显示,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力等悉数领先,并具有产业级、知识增强两大特色。

IDC 指出,文心大模型呈现出较强技术实力和平台积累,并认为“文心大模型+深度学习平台”的组合创造了AI研发应用新范式,能满足市场大规模落地需求;同时,背靠海量知识和丰富应用场景,百度目前已构建起一套“大模型+工具平台+产品与社区”的三层体系,形成了支撑大模型产业落地的关键路径。

IDC中国副总裁兼首席分析师武连峰认为,目前的文心大模型,能为百度即将发布的大语言模型“文心一言”提供强大的技术支持。
做大语言模型,百度并非从零开始

罗马不是一天建成的。百度对大模型的投入,要追溯到2019年。

2019年3月,百度率先发布中国首个正式开放的预训练模型ERNIE1.0,开启了中国大模型的修炼进化之门;2020年,百度开始将文心大模型应用到搜索业务;此后两年两次升级,到2021年7月,百度百亿参数规模的知识增强型预训练模型ERNIE 3.0 问世,这是当时业界首次在百亿级预训练模型中引入大规模知识图谱;当年12月,百度联合鹏城实验室打造了参数规模达2600亿的“鹏城-百度·文心”,成为全球首个知识增强千亿大模型,也是当时全球最大中文的单体模型。

如果说这之前的积累都在高高在上技术端,那随后的2022年,百度开始寻求让大模型“接地气”。

2022年,百度在业内首次提出行业大模型的思路,力图帮千行百业化繁为简地享受AI带来的技术红利,推动大模型向“产业级”进化。

通过与多家企业、机构联手,百度在2022年研发了多款融合行业数据、知识以及专家经验的行业大模型。如百度联合CCTV-电影频道,发布了业内首个影视行业“智感超清大模型”——电影频道-百度•文心,它每天可修复28.5万帧“老镜头”,一举解决了绝大部分画面的修复问题。即便是需要人工进一步精修,修复速度也能提升3~4倍。

诸如“智感超清大模型”这样的行业大模型,截至2022年11月,百度已累计发布了11个,涵盖工业、能源、金融、航天等领域。

百度文心大模型全景图

从这组数据也可以看出,国内并非没有“能打”的大模型,只是在发展路径上选择了不同的道路。特别是,百度不仅具备大模型所需的算力、数据和算法,还构建了自下而上的“芯片—框架—模型—应用”四层技术栈,围绕 AI技术落地应用夯基打桩。

这也正是百度打造大语言模型“文心一言”的底气。归根结底,ChatGPT 也只是基于自然语言理解的维度提供生成式 AI文本,这对于拥有技术和工具平台的百度而言,是一个“如何作为”的问题。换句话说,经过多年技术积累和发展,百度已形成能培育大语言模型产品的肥沃土壤。
中小参与者该如何“上车”?

最新信息显示,在资本的疯狂追逐下,诞生了ChatGPT的OpenAI目前估值已达290亿美元,成为全球目前估值最高的独角兽。

尽管还未形成清晰的商业模式,ChatGPT 的爆火仍然明白无误地提示,生成式AI(AIGC)所勾画的产业机会充满想象力。

但也应该看到,ChatGPT的成功,来源于背后十几年的积累——从大规模预训练语言模型GPT2开始,OpenAI就开始集中攻关生成式模型,再加上海量的互联网数据以及40多个团队长年对模型进行反馈的强化学习,才诞生了ChatGPT。

这看似“简单”的积累,成本令人咋舌。有研究估测,训练1750亿参数语言大模型GPT-3,需要上万个CPU/GPU 24小时不间断输入数据,所需能耗相当于开车往返地球和月球,一次运算就要花费450万美元。

这反映了一个冰冷的事实:大模型的技术特点决定了其高昂的研发门槛、持续的资金消耗和复杂的AI基座建构,这对于中小型企事业实体而言并不友好。换言之,大模型天然是科技巨头押注的竞技场。

事实也正如此,时下的主流大模型多是由科技巨头以及少数研究机构掌握。

面对时代热潮,中小参与者该如何“上车”?

开放“云上共享”可能是个好消息。在最近关于大语言模型“文心一言”的官方发布中,百度集团执行副总裁、百度智能云事业群总裁沈抖表示:“文心一言的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。”

连日来,文心一言已经受到诸多知名企业关注,据了解,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300家头部企业宣布加入百度“文心一言”生态。百度也称,在文心一言发布后,将宣布“生态伙伴计划”,全面支持生态上下游共同加快类 ChatGPT走向千百行业的脚步。

在《2022中国大模型发展白皮书》中,IDC 也表示,大模型在推进产业智能化升级中已表现出巨大潜力,企业应该尽早关注。

IDC 发布的《2022中国大模型发展白皮书》 (除注明外,本文图片来源百度)

“各行业技术买家都应该尽早拥抱大模型。”IDC建议,行业用户与头部供应厂商进行联合,不论是在品牌效应还是技术发展上都可能会看到“1+1&>2”的效应,带动自身业务发展。同时,数据的融合也将反哺头部企业大模型精准度、效率的提升,实现双赢。
排版 | 志海

相关阅读

  • 新一代金属支撑固体氧化物燃料电池问世

  • 科技日报讯 (记者王延斌)2月18日,全球首款大功率金属支撑商业化SOFC(固体氧化物燃料电池)产品在山东济南发布。该产品的热电联产效率高达92.55%,创造了大功率SOFC热电联产系统效率
  • 游戏技术助推“数实融合”迈向新高度

  • 各类游戏引擎已成为数字环境构建的重要平台,未来能够搭建超大数实融合场景,支持海量用户实时交互。此外,扩展现实、数字人技术将为“复合宇宙”创造重要的技术入口,这些技术离不
  • 中国首次主持制定铁路电气化技术领域国际标准

  • 2月16日,中铁第四勘察设计院集团有限公司主持并代表中国向国际电工委员会IEC/TC9提交的国际标准提案《轨道交通 列车过分相系统匹配技术准则》通过全球成员国投票,正式成立新
  • 何梁何利奖!祝贺程玉华教授!

  • 2月17日,何梁何利基金2021和2022年度颁奖大会在北京钓鱼台国宾馆隆重举行。国务院副总理刘鹤出席大会并讲话,全国人大常委会副委员长吉炳轩,全国政协副主席、中国科协主席万钢
  • 民乐县林草局多举措建设专业技术人才队伍

  • 民乐县林草局认真履行人才工作职责,创新人才工作体制机制,大力开展人才教育培训、林业技术推广服务,林业有害生物防治等,不断推进人才队伍建设,促进全县林草产业快速发展。不断深
  • ChatGPT,眼瞅着成为“云战场”?

  • 如果要在最近几个月的互联网圈里找一个“顶流”,那一定非ChatGPT莫属。它就像一个黑洞,产生的吞噬引力让国内外各大科技公司无一不卷入这场AI竞赛。不过,现阶段市场的焦点更多

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 锚定中国版ChatGPT,百度底气何来

  • 文 | 《中国科学报》 记者 赵广立过去两个多月,“狂飙”,是ChatGPT的常态。 这个诞生于美国AI研究机构OpenAI的人工智能(AI)聊天机器人,不仅持续霸榜科技头条,更一举成为互联网史上
  • 天祝公安:防诈宣传出实招 守好群众“钱袋子”

  • 今年以来,天祝县公安局坚持以“宣传防范好 电诈发案少”为目标,全警动员,靠前作为,不断创新防电诈宣传举措,使电信诈骗宣传深入群众日常生活,为群众打好“预防针”、提高“免疫力
  • “同运动•一家亲”城市嘉年华活动圆满落幕

  • 2月的雅安,风和日丽,气候宜人!沐浴着党和祖国关怀的春风,雅安人民迎来了一场别开生面而又意思非凡的活动!“同运动·一家亲”——城市嘉年华雅安站于2月19日在雅安高颐阙文博公园
  • 菏泽鲁西新区:专项检查守护群众“药箱子”

  • 为进一步加强医疗机构药品、疫苗、医疗器械监管工作,有效防范化解质量安全风险隐患,近日,菏泽鲁西新区综合行政执法局对辖区药品医疗器械使用环节开展质量安全检查,确保人民群众
  • 京津冀三地海关业务协同持续优化口岸营商环境

  • 今年是京津冀协同发展走过的第9个年头。9年来,京津冀三地海关着力通关监管业务协同,不断释放改革红利,持续优化口岸营商环境。2022年,京津冀地区进出口总值首次突破5万亿元关口,