服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

智源推出飞智大模型技术开源体系,包含FlagAI、FlagPerf等六大模块

日期: 来源:DeepTech深科技收集编辑:路雨晴



以 ChatGPT 为代表的大模型的出现,推动人工智能迎来了全新的发展浪潮,也引发了后者在技术范式上的变革。作为一种体系化的技术路径,其背后少不了算法、算力和数据的支撑。


在此发展背景下,要想更好地提升大模型技术的创新能力,不仅要扎实推进基础设施的建设以及大模型应用的开发和普及,更要构建开源开放的生态格局。


北京智源人工智能研究院(以下简称“智源”) 是一家人工智能领域的非盈利性质的新型研发机构,也是研究中国大模型的科研机构。


为加速大模型方向的协同创新,智源于近日发布 FlagOpen(飞智)大模型技术开源体系,其主要包括 FlagAI、FlagPerf、FlagEval、FlagData、FlagBoot 和 FlagStudio 六个部分。


全新推出大模型技术开源体系,赋能中国大模型技术创新能力提升   


(一)FlagOpen(飞智):大模型技术开源体系


FlagOpen 是智源与多家产学研单位共同构建的大模型开源开放软件体系。为了更好地推动大模型软硬件生态的建设,该体系包括算法、模型、工具、评测等多个部分,目标要支持多种深度学习框架和 AI 芯片。 


图丨FlagOpen(飞智)大模型技术开源体系(来源:资料图)


据介绍,FlagOpen 能够降低大模型开发的难度,助力全球开发者开展各种大模型的开发和研究工作,让更多的开发者以开源开放的方式,进行自由探索和协同创新。


据悉,未来 FlagOpen 也将为全球 AI 企业和机构,提供 AI 大模型软件发行版本、平台、商业化软件构建方面的支撑。(FlagOpen 开源平台入口:https://flagopen.baai.ac.cn)


(二)FlagAI :大模型算法、模型及工具一站式开源项目


对于算法开发人员来说,其总会面临在浩瀚的开源世界中寻求质量较高、值得信任的算法的需求,也会在集合不同的优化技术工具时,遭遇算法和开源的其他工具无法匹配的问题,这会给其正常高效的工作开展造成不可小觑的影响。


作为一个能够提高大模型开发效率的工具,FlagAI 集合了全球最主流的大模型算法技术和多种加速优化的技术,赋能模型开发的高效训练和有针对性的细节调整。


目前,FlagAI 已经集合了语言大模型 OPT、视觉大模型 ViT、Swin Transformer 等多种国内外主流大模型算法,也包括智源自己的“悟道”大模型 2.0、3.0 等重要模型。此外,FlagAI 已加入 Linux 基金会。


(三)FlagPerf:面向多种 AI 硬件的一体化评测引擎


快速高效地对 AI 软硬件进行适配和评测,解决目前其面临的兼容性差、技术栈异构程度高等问题,是建设 AI 生态的关键环节。


作为面向多种AI硬件的一体化评测引擎,FlagPerf 目标是支持多种芯片和深度学习框架,构建专业且不断迭代的评测体系,赋能 AI 产业生态的发展和繁荣。


目前,FlagPerf 已经联合天数智芯百度 PaddlePaddle、昆仑芯科技、中国移动等企业开展 AI 硬件评测建设的工作。


(四)FlagEval:多领域、多维度的基础大模型评测开源项目


为推进大模型研发的落地,以及对生成任务的客观评价,智源构建了大模型评测工具开源项目 FlagEval,希望未来能够满足多维度、多模态领域的全面评测。


FlagEval 首先开放的是多模态领域——CLIP 系列模型评测工具,是业内首个完整支持多种语言、多种评测难度和任务的文-图跨模态评测工具。之后还将发布更多不同领域和维度的评测工具。


(五)FlagData:开箱即用、易于扩展的数据工具开源项目          


基于过去四年来的不断积累,智源研究院着手数据建设工作,构建了 WuDaoCorpora 语料库,同时开发了一批数据处理的工具。


因此,为了更好地搜集、清理和整理数据,使其能够呈现一种标准可用的状态,是亟需面对和解决的关键。


FlagData 正是在此需求之下应运而生的一款数据工具,其包括清洗、标注、压缩、统计分析等功能在内,能够帮助大模型开发团队完成高质量的数据处理,进而优化和提升大模型的质量。


当下的 AIGC 只是冰山上的小小一角   


在不知不觉中,人工智能已经走过了多年的发展历程。2022 年以来,利用人工智能技术来生成内容(AI Generated Content,AIGC)的蓬勃发展态势,让越来越多的人看到,因大模型的推进而不断派生出的 AI 落地和普及发展的可能性。


在林咏华看来,目前我们正在走由大模型技术推动的向 AIGC 元年,全球范围内尤其是中国的很多企业和团队都纷纷尝试打造自己的 AIGC 应用,也在陆续出现很多类 ChatGPT 的产品模型。


“但是大家所看到的只是冰山浮在水面的部分。要打造 AIGC 的能力,无论是文生图还是 ChatGPT 的能力,都离不开水面之下大模型很厚的全栈技术。”林咏华表示。


具体来说,文生图和 ChatGPT 等应用都离不开强大的语言预训练大模型、视觉基础大模型、图文基础大模型等作为支撑的重要基座。


“大模型只是 AI 从一个高技术领域转入普及的全民应用的代表性产品,远非 AI 技术生态的全部。”北京智源人工智能研究院院长黄铁军表示,如果把开发出的大模型比作能够发电的发电机,那么发电机和能够作为产品和服务走入千家万户的电力相比,“还存在着很长的距离”。


此外,不断提高为 AI 系统的高效运行做支撑的算力,以及构建客观公正的大模型的评价方法,也是推进 AIGC 向前发展的不可或缺的重要环节。


基于此,智源致力于从上述层面出发,集合打造一款包括以上核心内容的技术体系,因此也就有了这次 FlagOpen 大模型技术开源体系的诞生。


“开源本质上是一个大家共建并持续发展的过程。我希望大家共建的开源开放体系,在将来做 AI 的产品或者 AI 的服务时能够用上。”黄铁军表示。


推进大模型持续创新   


作为一种深度学习新范式,预训练模型在经过大量的数据训练之后,可以执行语言理解、图片处理等特定的任务。而大模型,正是预训练模型的代称,这一词语由智源于 2021 年率先提出,后成为学界和业界约定俗成的术语。


近年来,智源始终坚持不懈地走在推进大模型持续创新的发展道路上。其于 2020 年启动了大模型研究的战略方向,完成了大模型攻关团队的搭建。


2021 年 3 月,其推出已经完成了百亿和千亿参数规模预训练的超大规模智能模型“悟道 1.0”。


经过联合攻关,智源又于 2021 年 6 月发布了拥有 1.75 万亿参数量的“悟道 2.0”。


对于“悟道”项目来说,林咏华认为其最重要的意义是帮助锻造了当前中国大模型研究领域的中坚力量。“在过去的两年,我们不断地投入、支持’悟道’大模型研究项目,帮助中国培养了一批大模型的创新团队和研究者。”她说。


据介绍,2022 年以后,智源在大模型上的发展朝着更深、更宽的方向迈进。智源不仅致力于“悟道 3.0”向视觉、文图等多模态领域发展,并通过 FlagOpen 这样的开源体系的建设,推动开放创新。此外,其也将组织和承担科技部 2030 人工智能旗舰项目“人工智能基础模型支撑平台与评测技术。


相关阅读

  • ChatGPT引发互联网治理新变局

  • ChatGPT是结合了人类反馈强化学习与大数据预训练语言模型的自然语言处理工具。ChatGPT的问世,引发了国内外的广泛关注,同时也正在人工智能领域引发新一轮的科技竞赛。实现交互
  • ​人工智能技术解密——机器视觉技术及应用

  • 点击下方卡片,关注“新机器视觉”公众号重磅干货,第一时间送达来源:长虹AI实验室视觉是人类最敏感、最直接的感知方式,在不进行实际接触的情况下,视觉感知可以使得我们获取周围环
  • 「微侃」增程式车型的后来居上

  • 聚焦汽车科技,剖析产业趋势和变革浪潮————————一年多以前,大家还在讨论“增程式技术到底是不是落后的技术”,这个命题当时是长城旗下魏牌首席执行官李瑞峰首先提出,华为
  • 80后“复原”高启强老家,满满细节令张颂文破防

  • 电视剧《狂飙》里,高启强旧厂街上那个小家经山东济南一位80后的巧手“微缩”20倍,超还原细节,3月6日,扬子晚报/紫牛新闻记者联系上了这位微缩模型制作师李寿升,听他分享还原老物

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 郑永年:大湾区发展空间巨大,香港大有可为

  • IPP评论是国家高端智库华南理工大学公共政策研究院(IPP)官方微信平台。导读2023年是《粤港澳大湾区发展规划纲要》颁布实施四周年,也是疫情后内地与港澳人员往来全面恢复之年。
  • 惊蛰,走进余杭校园,与你听风望春来!

  • 传统节气今日惊蛰始春雷响,万物长标志着仲春时节的开始 此时节春到人间草木知,闲看校园春烂漫推开窗,明丽的春色映入眼帘余杭校园里无处不春光今春的余杭校园美景图上线Are U r
  • 突发,价格战打响了!

  • 又是打酱油的一天,虽然盘中跳水,创业板一度创下新低,但下午又V了回来!新能源、半导体、军工三大渣男护盘,但全天看,并没有太多激情。外资今天没跑,但内资跑了350亿。鸡狗们每次开会
  • “钱多事少老板好”的公司,真的存在吗?

  • 《半泽直树》 不管从事什么工作,我们或多或少都身处在组织当中,公司就是现代社会最常见的组织。在组织里,我们会关心组织的目标是什么;组织的边界和范围是什么;成员的角色分工是