服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

阿里内测达摩院版ChatGPT,提前曝光!

日期: 来源:程序员泥瓦匠收集编辑:

点蓝字关注,一起程序员弯道超车之路


萧箫 发自 凹非寺

量子位 | 公众号 QbitAI


谷歌硬刚ChatGPT消息一出,科技圈全坐不住了。


就在昨晚,阿里百度网易京东一众公司全宣布要推出类ChatGPT新产品,战况那叫一个激烈。


阿里内测中的达摩院版ChatGPT,也被提前曝光。


竟然连画画技能都具备了?!



ChatGPT类型的对话功能,同样不在话下。先来个NBA话题铺垫:



当被问到“乔丹和科比谁更伟大”时,开始暴露篮球迷身份,连“毋庸置疑”、“奉为神迹”这种话都出来了:



还是个乔丹死忠粉,能对你老婆的观点提出异议(手动狗头)



看起来这个达摩院版ChatGPT,不仅有纯文本任务能力,还融合了多模态任务能力。


这究竟采用了什么样的技术?阿里这次内测中的类ChatGPT产品,能力如何?

基于通义融合升级


据透露,新产品可实现的功能包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。


一言以蔽之,不仅ChatGPT具备的能力它都能实现,而且多了“AI绘画”这项功能。


能取得这样的多任务、跨模态效果,背后本质上离不开阿里通义大模型的能力。


新达摩院版ChatGPT,正是基于通义大模型体系进行融合升级。


据报道,推出的通义大模型底座基于统一学习范式OFA等底层技术打造,具备了能搞定多种任务的“大一统”能力:


不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。

升级后,更是可以处理超过包括语音和动作在内的30多种跨模态任务。



这里“大一统”技术的关键,在于提出并实现了三个“统一”:


  • 架构统一。使用Transformer(encoder-decoder,编解码器)架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。

  • 模态统一。不管是NLP、CV这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。

  • 任务统一。将所有单模态、多模态任务统一表达成序列到序列(Seq2seq)生成的形式,同类任务的输入几乎就是“一个模子里刻出来的”。


目前推出的通义大模型,在电商跨模态搜索、AI辅助设计、法律文书学习、医疗文本理解、开放域人机对话等200多个场景中应用落地时,均能达到2%~10%的效果提升。


从阿里的研发来看,他们实际上于2020年左右已经开始布局此类技术研究。


2021年推出“中文版GPT-3”PLUG,参数量270亿,但跟GPT-3一样是“万能写作神器”。


例如这是小说续写的效果:



去年,阿里AliceMind模型更是在CLUE榜单的AI中文语言理解任务上得分首超人类,获得了86.685高分。


CLUE榜单会从文本分类、阅读理解、自然语言推理等9项任务中全面考核AI模型的语言理解能力,但参评AI模型一直未能超越人类成绩,AliceMind则一举在4项任务中超过了人类水平。


国内厂商纷纷追逐ChatGPT


所以,此次推出类ChatGPT产品,阿里究竟是怎么想的?


其实阿里通义大模型体系中,有不少模型都已经在魔搭社区开源。


魔搭社区由阿里达摩院与CCF开源发展委员会共同发起,目前社区内有300+模型上线,其中包括10多个大模型和150+ SOTA模型,其中三分之一都支持中文。


但据知情人士透露,阿里长期以来的目标依旧没变:

打造中文ChatGPT的生态,这个定义对于阿里来说可能窄了一点。相比之下,阿里更希望能引领中文大模型的发展趋势。


不止阿里,包括百度、网易、京东等各科技大厂也都已经坐不住了。


百度正在对类ChatGPT产品“文心一言”进行内部测试,官方宣布测试完成时间在3月左右,但是否会因为这波热度提前还不好说。


网易也剧透,未来网易有道可能会推出ChatGPT同源技术产品,主要在在线教育一块实现应用。


京东集团副总裁何晓冬则表示,京东是加速AIGC和ChatGPT规模化落地的最佳场景,未来借助这一系列成果,将加速AI在国内的应用落地。


这波国内外厂商的ChatGPT热潮,很快就要起来了。





↑ 点击即可关注 


关于我的近况

目前在 SaaS 创业中,如果你想成为技术高管或技术转创业,那必不可少的要懂商业、营销、产品等等。

也可以点击下方去阅读我 SaaS 创业的原创公号分享


相关阅读

  • 聊聊复旦发布的 MOSS ,国内版 ChatGPT

  • 点蓝字关注,一起程序员弯道超车之路来源 | 机器之心ChatGPT 是最先进的 AI,也是最热门的应用 —— 自去年 11 月底发布以来,它的月活跃用户两个月超过一亿,轻松拿到了全球互联网
  • ChatGpt+Vits使用体验

  • 网安引领时代,弥天点亮未来 0x00故事是这样的声学模型(1).声学模型是声音合成系统的重要组成部分。(2).主流的声学模型主要有Tacotron,FastSpeech。VITS也是一个声学模型(1
  • ​WWW 2023 | 自监督多模态推荐系统

  • ©PaperWeekly 原创 · 作者 | 韦玮单位 | 香港大学研究方向 | 推荐系统今天给大家介绍一篇香港大学黄超老师实验室发表的关于多模态自监督推荐系统的文章。论文题目:Multi-M
  • 量化交易实盘7年,我的一些感悟

  • 我试着将这几年,自己从一个小白,再到现在的一些感悟写下来在量化模型运行初期,要尽可能思考完善你的策略模型,完善的意义不是指冗长的代码,或是开关环节,而是指你的量化模型需要形
  • 全球化趋势下,如何建设稳定高效的技术能力?

  • 作者 | 任传英如果将全球化比作一场航行,每个期望走出去的企业都是水手,那么是造一艘属于自己的船,还是搭乘已有的船呢?在不同的时间和场景下,相信每个水手都有自己的答案。近几
  • 出微软记

  • 作者:K K编辑:李凡本文经授权转载自:新立场NewPosition微软亚洲研究院(MSRA),一个深植在中国互联网进程中的名字,正悄然落寞。去年,随着国防七子与北邮学子被拒之门外,其名字才又一次

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 阿里内测达摩院版ChatGPT,提前曝光!

  • 点蓝字关注,一起程序员弯道超车之路萧箫 发自 凹非寺量子位 | 公众号 QbitAI谷歌硬刚ChatGPT消息一出,科技圈全坐不住了。就在昨晚,阿里百度网易京东一众公司全宣布要推出类Cha
  • 阿里开源的低代码引擎 LowCodeEngine

  • 点蓝字关注,一起程序员弯道超车之路LowCodeEngine是由阿里巴巴钉钉团队开源的低代码引擎, 该引擎全面遵循《阿里巴巴中后端前端基础构建协议规范》和《阿里巴巴中后端前端素材
  • 影院这些“多余消费”,引发观众吐槽?

  • 前段时间,小艾在冲浪时看到有微博网友吐槽:“现在那些在黄金位置座位加装按摩椅的影院真的太可怕了。坐一段时间就会自动运行,根本不是在按摩,像是从后面给人‘上刑’。而且开场
  • 一个程序员全职外包,你觉得是否有出路?

  • 点蓝字关注,一起程序员弯道超车之路来源:juejin.cn/post/7032317937339858952背景鄙人本科毕业一年有余,计算机专业。全栈工程师,但更喜欢前端的工作,于是在一家游戏公司任职前端
  • 程序员“副业”灵感指南 2023

  • 点蓝字关注,一起程序员弯道超车之路来源:InfoQ、整理:Tina2023 年,你考虑做个副业吗?去年 10 月,“北京女孩副业上门喂猫一周赚 5 千”登上热搜。既能撸猫,还能挣钱,许多网友感叹“