服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

ChatGPT搅动AI又一波风潮,却扒出了百度的长板

日期: 来源:佳人自有妙计y收集编辑:佳人自有妙计y

文|智能相对论

作者| 叶一城

野火燎原,openAI搞出的chatGPT大有当年alphaGo的架势,搅动整个AI业界春心荡漾。

从openAI的大金主微软,到昔日明星alphaGo的爸爸Google,都火急火燎地要出来表态——前者要彰显主权并在内部全面应用,后者作为全球AI领头羊怎么能失了对称的地位,要发布对应的产品。

国内科技圈自然也发扬了闻风而动的优良品格,在元宇宙概念疲软后,有关的没关的都纷纷贴上来。股市上各种妖魔鬼怪横行,对于上涨,某些董秘的回复中,否定或许还带着捡漏的窃喜。

而“AI大户”百度在宣布发布类似的产品“文心一言”后,股价也立刻上涨。

股民们冤不冤?这次可能不太冤,因为就“中国版ChatGPT”而言,不管腾讯、阿里怎么站位的,某种程度上百度确实最有技术资格,也最能从ChatGPT的落地应用中获得现实的商业价值。

判断谁能在技术的风口上占便宜,第一步永远是先看技术的本质。

ChatGPT从产品形态上,是“一个使用自然语言处理技术实现和人类互动对话的产品”,而其内在本质,就是一个预训练大模型。所谓“大”,就是在巨量到一般人无法想象的数据训练下拥有庞大的参数规模,因为“大”而见识多,博学多才,任何领域都懂,只要稍微调教一下就能出产特定场景的应用。

ChatGPT并不是一次性发展而来的,其属于openAI的一系列预训练模型,所谓GPT,即Generative Pre-Trained Transformer,就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。从已经公布的论文看,从2018年起,GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,而目前火得一塌糊涂的ChatGPT,更像是一个GPT-4之前的过渡版本GPT-3.5,因为强大的对话能力突然爆火起来。

不同的是,ChatGPT采用了新的指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,前者为ChatGPT带来理解能力,后者通过人工标注反馈的方式来增强模型的效果,实现GPT的进化。

在一系列进化下,ChatGPT的参数总量与GPT-3一致,达到了1750亿,实现了从GPT-2的15亿的跳跃。

说到底,ChatGPT就是一个积累已久、有着特殊训练方式的大模型,它的发展是有技术进化路线的。

而“巧合”的是,百度大力投入的产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,其技术演进几乎走出了同样的进程。

早在2019年3月,百度就做出了文心 ERNIE 1.0,这一技术创新与“同类”GPT-1、BERT的差距都只有几个月,而且百度积累的大规模知识和海量多元数据,让文心得以快速发展——搜索业务给大模型所需要的庞大数据训练量带来了天然的便利。

例如,在文心的发展过程中,2021年,ERNIE 3.0大模型即拥有千亿参数;与超强算力方联合的鹏城-百度·文心作为一款融合了自然语言理解和自然语言生成的大模型,其参数量达到了2600亿,相对GPT-3和ChatGPT提升了50%。

去年9月,百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。据推测,百度那时候就开始做文心一言。

除了参数规模扩大、能力增强,文心与ChatGPT一样,也在适应不同需要进行技术进化。目前文心大模型总量已经有36个,以其中的知识增强轻量级大模型ERNIE 3.0 Tiny为例,该模型能够通过多任务知识蒸馏手段将千亿多任务大模型的所学迁移至轻量级模型中,训练了10亿级、亿级、千万级不同体量大小的轻量级大模型,实现了优秀的泛化能力。

回过头来看,百度在技术上一直在做与GPT相同的事,但是晦涩的技术决定了它始终缺乏足够的曝光度,直到大洋彼岸的ChatGPT突然搞出了“大新闻”,举起了旗帜,于是,这就成了百度彰显自身技术能力的契机。

从GPT-3到ChatGPT,与从“文心”到“文心一言”(英文名ERNIE Bot)的命名方式,也“惊人巧合”——原本就是一样的技术迭代过程罢了,百度之所以3月就能马上做出来,甚至按目前的节奏内测还可能提前,原因就在于ChatGPT要的那些技术百度都有,产品上再加入对话算法等,很快就能对齐。

至少在NLP领域,目前国内还没用企业能够看齐百度。

而在现实价值方面,实际上ChatGPT做的各种对话、各种辅助功能,都与百度的业务线较为契合,无论是内部的搜索+信息流,还是对外提供的诸如智慧城市等B端解决方案中,都能得到很好的利用。

尤其是,AI与搜索的契合一直是百度近些年的努力方向,以传统精确搜索为主、“文心一言”的工具型搜索为辅的方式,也更符合未来搜索的形态。

当然,其他辅助的,比如芯片(算力相关)、开发框架(飞桨),百度也都有成熟的“基建配套”了,

不过,百度面临的问题还是那个老生常谈的话题:能不能持续投入下去,等待真正的商业价值回报?毕竟,ChatGPT吹得再响,现实的问题肯定少不了,得有一个成熟的过程。

说白了,在没有进入强人工智能时代,ChatGPT再厉害其本质也只是“小孩学舌”,学得更多当然就更像,但也只是“知其然不知其所以然”。

这不是说小孩学舌就没有用,能够学起来很像、能解决一些问题,价值也很大。只不过,带过孩子的都知道,小孩学舌在面临认知问题时,会出现很多逻辑尴尬。

目前ChatGPT在一些对话上就出现了这个问题,例如解一道简单的数学题,能给你扯一大堆,但结果就是不对。又例如很多专业领域的会话,和官样文章一样看似内容很多、逻辑严密,但就是言之无物。

一些程序界大佬惊呼ChatGPT的健壮性远超人类,要开除外包程序员,实际危言耸听。所谓健壮性无非就是设定规则的执行,就像数数,人从0数到300,肯定容易出错,机器数,当然就不会出错,没啥好惊奇的。

无论如何,ChatGPT还有一些路要走,最有资格也最能得益的百度,在风潮面前仍然要咬牙继续坚持才好,这其中的投入或许会更大。

*本文图片均来源于网络


相关阅读

  • ChatGPT狂飙科技圈,百度AI还只能写高考作文?

  • 2月7日下午,百度在其微信公众号官宣:大模型新项目文心一言(英文名ERNIE Bot)。据媒体报道,该项目与ChatGPT类似,预计3月完成内测,向公众开放。尽管目前百度对该项目尚未披露具体信
  • 元宇宙视域下媒体发展面临的机遇和挑战

  • 作 者:郭全中:中央民族大学新闻与传播学院教授、江苏紫金传媒智库高级研究员;杨元昭:中央民族大学新闻与传播学院硕士研究生来 源:《全媒体探索》2023年1月刊摘 要:元宇宙
  • 安徽省教育招生考试院重要通知!

  • 2月7日安徽省教育招生考试院消息根据考试工作安排安徽省2023年普通高中学业水平合格性考试(以下简称“合格性考试”)即将进行现将考试有关事项提示如下↓↓↓一、考试内容根据
  • 以人为本推进教育数字化转型

  • 日新月异的数字技术,愈发成为驱动人类社会思维方式、组织架构、运作模式发生根本性变革和全方位重塑的引领力量。以人为本推进教育数字化转型,是中国式现代化人才支撑的战略性
  • 小小擀饼店 倾囊传手艺

  •   潍坊日报社潍坊融媒讯 2月6日一大早,高新区玄家朱茂集贸市场一家手擀饼店前围满了顾客,有来买饼的、有来学习面饼加工技术的、有来应聘打工的。这家不大的店铺凭借传统手
  • 南京江宁:科技创新 高新技术产业驶入快车道

  • 近日,2021年度南京市百强高新技术企业评选名单公布,其中,江宁区拔得头筹,占据33个席位。“抓创新就是抓发展,谋创新就是谋未来”,江宁区科技局以全力打造先行区为目标,深入实施创新

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • ChatGPT搅动AI又一波风潮,却扒出了百度的长板

  • 文|智能相对论作者| 叶一城野火燎原,openAI搞出的chatGPT大有当年alphaGo的架势,搅动整个AI业界春心荡漾。从openAI的大金主微软,到昔日明星alphaGo的爸爸Google,都火急火燎地要
  • 全国“仿种子”清理取得阶段性成效

  •   新华社北京2月7日电(记者于文静)农业农村部近期发布第三批非主要农作物品种登记撤销公告。自2021年以来,全国“仿种子”清理取得阶段性成效,依法有序清理向日葵、甜瓜、黄
  • 向人民汇报|新乡环路体系得到完善提升

  •   河南日报客户端记者 赵同增  2月7日下午,新乡市政府新闻办组织召开第三场民生实事新闻发布会——“完善提升环路体系专场”新闻发布会。记者从发布会获悉,2022年,新乡市