服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

【国信计算机】人工智能行业点评:英伟达GPU、DGX云、AI工厂三驾马车发布,AI算力和应用再迎跃迁

日期: 来源:火星计算机收集编辑:国信计算机

事项:

英伟达本周举办GTC大会,围绕AI、量子计算、芯片等前沿科技发布了一系列产品:如用于量子计算、光刻等领域的加速库;面向AI、数据中心等领域的CPU、DPU加速芯片;面向AI超级计算集群出租的DGX云;用于生成式AI的大模型“代工厂”;面向AI视频、ChatGPT等应用的推理芯片平台;面向智能制造的Omniverse 虚拟工厂。对于当前发展火热的AI产业,英伟达发布会成为市场关注焦点。

国信计算机观点:1)ChatGPT在AI问答上的优秀表现引爆网络,GPT-4能力更加卓越,OpenAI面临的访问流量呈现快速增长态势。最新的GPT-4访问价格已上涨数倍,其算力消耗和成本必然也有较大提升。AI大规模的应用和普及,算力是瓶颈之一,英伟达发布产品有望助力AI产业跃迁;2)芯片端,英伟达H100 NVL专门针对生成式AI语言模型设计,可以将大型语言模型的处理成本降低一个数量级;3)云端,公司DGX云服务更方便快捷的出租AI超级计算集群算力,对于AI创业公司将大幅降低投入成本,有望繁荣AI生态;4)应用端,公司已推出语言、视觉、和生物学三大模型,AI模型“代工厂”的角色,让各类行业客户更加容易训练并使用针对自身的AI应用模型,将进一步普及AI应用;5)英伟达为AI产业,从算力到应用均带来跃迁,将加速AI的应用和落地。参考国内产业对比,以百度文心大模型发布来看,国内也会逐步复制国外AI产业的发展路径,且当前已具备一定的应用案例,我们持续看好国内AI产业的发展,重点关注AI算力、算法、应用相关产业和标的;5)风险提示:AI等应用发展和落地情况不及预期;国内AI产业发展不及预期;国内算力、芯片等基础环节进展缓慢等。

评论:

  • 英伟达发布ChatGPT专用GPU,算力基础大幅提升

英伟达再发重磅GPU产品,AI的“iPhone时刻”来临。英伟达本次发布会展示了多项产品和技术,其中GPU性能的持续提升一直是大会焦点。英伟达发布了全新的GPU推理平台,该平台包括4种不同配置,针对不同工作负载进行优化:

L4:针对AI视频工作负载。L4在视频解码和编码、视频内容审核、视频通话功能等领域做了较大优化,其在AI视频加速方面比CPU高120倍的性能。一台8-GPU L4服务器将取代一百多台用于处理AI视频的双插槽CPU服务器。Google云已与其合作推出了新的云硬件产品 L4平台。

L40:针对Omniverse、图形渲染等生成式AI。L40推理性能是英伟达的云推理GPU T4的10倍;L40 是英伟达元宇宙Omniverse的引擎。当前火爆的AI图片生成平台Midjourney、Stable Diffusion等未来均是L40的潜在的可能应用场景。

H100 NVL:针对ChatGPT等LLM大语言模型的Hopper GPU。该产品是基于去年已经发布的H100的改进版本:配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起。H100可处理拥有1750亿参数的GPT-3,还可支持商业PCIE服务器扩展。英伟达宣称H100 NVL 提供的 GPT3-175B 推理吞吐量是上一代 HGX A100 的 12 倍(8 个 H100 NVL 对比 8 个A100)。H100 NVL 卡将于今年下半年开始发货,以满足当前对大语言模型训练的强烈需求。

Grace Hopper:针对推荐系统和大型语言模型AI数据库设计的超级芯片。该芯片可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU,非常适合处理大型数据集。

算力瓶颈制约AI大规模应用和普及,英伟达助力算力跃迁。近期OpenAI对于Plus付费用户的GPT-4访问连续下降阈值,已由最初的150 msg/ 4 hr下降至25msg/3hr;其理由主要是为了控制成本。由于ChatGPT在AI问答上的优秀表现引爆网络,GPT-4能力更加卓越,OpenAI面临的访问流量呈现快速增长。根据最新的GPT-4访问价格,其每1000个token的价格数倍于原GPT-3和GPT-3.5-turbo,因此其算力消耗和成本必然也有较大提升。英伟达最新产品即是解决算力瓶颈的关键,H100 NVL专门针对生成式AI语言模型设计,可以将大型语言模型的处理成本降低一个数量级。根据公司演示,训练Transformer模型从5天缩短到了19小时,而在结合了英伟达多项尖端软硬件条件下,整个模型训练从7天缩短到了20小时,效率足足提升9倍。算力性价比的提升,将帮助AI在各种应用下迅速普及。

  • 英伟达推出DGX云,AI即服务再次降低行业门槛

DGX Cloud云服务问世,让AI使用更简单。英伟达DGX Cloud是未来公司重点计划,公司提供了专用的NVIDIA DGX AI超级计算集群,搭配NVIDIA AI软件,向每家企业出租AI算力。英伟达的AI计算集群强大而昂贵,企业以云租赁的方式采购将更快、更方便的实现自身的AI训练和应用。目前英伟达已经和微软云、谷歌云、Oracle OCI开展合作,其首个NVIDIA DGX Cloud是与Oracle合作的云服务,每个实例每月36,999美元起。每个实例包括八个Nvidia H100或A100 80 GB GPU,每个GPU节点内存高达640 GB。计算资源是专用的,不与云中的其他租户共享,网络也在租户之间隔离。

参考IaaS到SaaS的发展逻辑,DGX云有望推动AI生态更加繁荣。以OpenAI大语言模型GPT3为例,其1750亿个参数,需要庞大成本投入和算力支持,一般企业难以涉足。目前在AI大模型领域持续投入的主要是互联网大厂,如谷歌、百度、阿里等;OpenAI的迅速发展也离不开微软等巨头的持续投资。因此,类似于2000年后云计算的兴起,IaaS让各类企业创业和发展更加容易,催生B端SaaS和C端互联网生态。可以预期,英伟达DGX云的推出,让AI创业更为方便,不再只是巨头游戏,未来AI应用和生态有望快速发展。


  • 英伟达AI代工厂再向前端迈进一步,模型应用值得期待

生成式AI不断取得突破,英伟达进一步推出模型制作服务。ChatGPT、Midjourney等生成式AI应用让整个世界为之振奋,也彰显了大模型极强的应用能力和价值。英伟达发布AI Foundations,旨在为用户提供定制化的LLM和生成式AI解决方案。英伟达希望扮演AI模型“代工厂”的角色,帮助客户构建、改进和操作自定义大型语言模型,这些模型和生成AI使用其专有数据和特定领域的任务进行训练。英伟达AI大模型包含语言、视觉和生物学三大模型:

NEMO:语言模型。NEMO是用于自然语言文本的生成式模型,可以提供80亿、430亿、5300亿参数的模型,且会定期更新额外的训练数据,英伟达AI专家也可以提供全程指导合作。根据NEMO模型,企业可以生成自己的大模型,实现客服、聊天机器人、撰写电子邮件等功能。NEMO模型是一个基于 PyTorch 的开源工具包,允许开发者快速构建、训练和微调会话式人工智能模型。NeMo 由 NeMo Core 和NeMo Collection 组成,在NeMo 的 Speech Collection中,可以找到用于语音识别、命令识别、说话人识别、说话人验证和语音活动检测的模型和各种构建模块。NeMo 的 NLP Collection(nemo_nlp)包含了诸如问题回答、标点符号、命名实体识别等任务的模型。本次发布会,公司还发布了 NVIDIA TAO Toolkit 5.0,借助 NVIDIA TAO(训练、适应、优化)工具包,开发人员可以利用迁移学习的强大功能和效率,通过适应和优化在创纪录的时间内实现最先进的准确性和生产级吞吐量,可以促进对话 AI 模型的培训和微调。

Picasso:视觉模型。Picasso用于训练包括图像、视频和3D应用的生成式AI模型。公司宣布gettyimages、Shutterstock将采用英伟达Picasso服务,Adobe将与英伟达共同打造新一代的生成式AI模型。以Shutterstock为例,其是一家面向创新品牌和媒体公司的领先创作平台。Shutterstock使用 NVIDIA Picasso 生成式 AI 云服务,使这些模型能够根据简单的文字提示创建生成式 3D 资产,同时将训练的 3D 模型转换为高保真的 3D 内容,创作时间可以从数小时缩短至数分钟。

Bionemo:生物学模型。Bionemo专门为用户提供创建、微调、提供自定义模型的平台,可用于蛋白质结构预测、蛋白质生成、蛋白质性质预测、分子生成、分子对接等各个流程。在数百家新的AI制药初创公司之中,英伟达已经积累了至少7家公司,作为Bionemo大模型的早期用户。

英伟达AI模型向产业前端再迈进一步,形成全产业链AI能力输出。英伟达再提供芯片、AI算力云服务后,也向产业提供自己的大模型能力,让客户能最简化定制自身需要的AI能力。AI“代工厂”可以类比为云计算中PaaS及SaaS层服务,实现AI全生命周期能力输出,更进一步推动AI的应用普及。目前英伟达推出了三大模型,且已在业内有所应用,未来有望进一步推出更多模型。除此之外,英伟达“工业元宇宙”Omniverse Cloud也是PaaS平台,旨在建设虚拟工厂,让各个行业在投入实际生产之前先以数字化方式设计、建造、运营和优化物理产品和工厂。

  • 投资建议:

以ChatGPT、Midjourney为代表的生成式AI应用席卷全球,对AI算力、算法、应用的需求已形成快速增长趋势。即使单个GPT-4的应用,算力和成本已呈现暴涨之势。英伟达近期发布的一系列产品对于AI产业形成较大的利好:芯片端,H100 NVL专门针对生成式AI语言模型设计,可以将大型语言模型的处理成本降低一个数量级。云端,公司DGX云服务更方便快捷的出租AI超级计算集群算力,对于AI创业公司将大幅降低投入成本,有望复制云计算催生B端SaaS和C端互联网生态,同样繁荣AI生态。应用端,公司已推出语言、视觉、和生物学三大模型,AI模型“代工厂”的角色,让各类行业客户更加容易训练并使用针对自身的AI应用模型,将进一步普及AI应用。因此我们认为英伟达为AI产业,从算力到应用均带来跃迁,将加速AI的应用和落地。参考国内产业对比,以百度文心大模型发布来看,国内也会逐步复制国外AI产业的发展路径,且当前已具备一定的应用案例,我们持续看好国内AI产业的发展:

算力端:重点关注中科曙光、海光信息等。

算法端:重点关注科大讯飞、三六零等。

应用端:重点关注金山办公、同花顺、凌志软件、彩讯股份等。

  • 风险提示:

AI等应用发展和落地情况不及预期;国内AI产业发展不及预期;国内算力、芯片等基础环节进展缓慢等。

相关研究报告:


  • 《人工智能行业点评-OpenAI访问限流,GPT-4算力测算》 ——2023-03-20

  • 《人工智能行业点评-Microsoft 365 Copilot发布,国内外AI应用有望加速落地》 ——2023-03-19

  • 《国央企ERP专题报告:数字化转型下的新机遇》 ——2023-03-10

  • 《计算机行业2023年3月投资策略暨年报前瞻-2022行业业绩承压,关注ChatGPT引发的AI+应用表现》 ——2023-03-06

  • 《人工智能行业点评-ChatGPT开放API接口,应用侧有望迎来全面爆发》 ——2023-03-05



分析师声明

作者保证报告所采用的数据均来自合规渠道;分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求独立、客观、公正,结论不受任何第三方的授意或影响;作者在过去、现在或未来未就其研究报告所提供的具体建议或所表述的意见直接或间接收取任何报酬,特此声明。


国信证券投资评级


重要声明

本报告由国信证券股份有限公司(已具备中国证监会许可的证券投资咨询业务资格)制作;报告版权归国信证券股份有限公司(以下简称“我公司”)所有。本报告仅供我公司客户使用,本公司不会因接收人收到本报告而视其为客户。未经书面许可,任何机构和个人不得以任何形式使用、复制或传播。任何有关本报告的摘要或节选都不代表本报告正式完整的观点,一切须以我公司向客户发布的本报告完整版本为准。

本报告基于已公开的资料或信息撰写,但我公司不保证该资料及信息的完整性、准确性。本报告所载的信息、资料、建议及推测仅反映我公司于本报告公开发布当日的判断,在不同时期,我公司可能撰写并发布与本报告所载资料、建议及推测不一致的报告。我公司不保证本报告所含信息及资料处于最新状态;我公司可能随时补充、更新和修订有关信息及资料,投资者应当自行关注相关更新和修订内容。我公司或关联机构可能会持有本报告中所提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或金融产品等相关服务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中意见或建议不一致的投资决策。

本报告仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本报告中的信息和意见均不构成对任何个人的投资建议。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。投资者应结合自己的投资目标和财务状况自行判断是否采用本报告所载内容和信息并自行承担风险,我公司及雇员对投资者使用本报告及其内容而造成的一切后果不承担任何法律责任。


证券投资咨询业务的说明

本公司具备中国证监会核准的证券投资咨询业务资格。证券投资咨询,是指从事证券投资咨询业务的机构及其投资咨询人员以下列形式为证券投资人或者客户提供证券投资分析、预测或者建议等直接或者间接有偿咨询服务的活动:接受投资人或者客户委托,提供证券投资咨询服务;举办有关证券投资咨询的讲座、报告会、分析会等;在报刊上发表证券投资咨询的文章、评论、报告,以及通过电台、电视台等公众传播媒体提供证券投资咨询服务;通过电话、传真、电脑网络等电信设备系统,提供证券投资咨询服务;中国证监会认定的其他形式。

发布证券研究报告是证券投资咨询业务的一种基本形式,指证券公司、证券投资咨询机构对证券及证券相关产品的价值、市场走势或者相关影响因素进行分析,形成证券估值、投资评级等投资分析意见,制作证券研究报告,并向客户发布的行为。





国信证券计算机团队介绍


擅长把握技术驱动型板块机会,注重海外映射投资机会;自上而下和自下而上相结合,“个股推荐”为主,服务次之。一二级联动,产业大局观较敏感。注重团队研究成果的标准化输出,把数字化引入研究本身。


熊 莉

计算机行业首席分析师

分析师资格编码:S0980519030002

西南财经大学经济学硕士,负责计算机行业研究,8年从业经验;金牛奖、金麒麟、水晶球均有斩获;统筹行业研究方向,深度覆盖海内外云计算、工业数字化板块。


库宏垚

计算机行业分析师

分析师资格编码:S0980520010001

复旦大学金融硕士,两年信息安全实业经验,四年行业研究经验,重点覆盖云计算、信息安全、轨交信息化。


朱 松

计算机行业分析师

分析师资格编码:S0980520070001

上海交通大学管理学硕士,重点覆盖互联网金融、医疗信息化、遥感IT,于2020年7月加入国信证券。


张伦可

计算机行业分析师

分析师资格编码:S0980521120004

加州大学欧文分校经济学学士、香港科技大学金融学硕士,重点覆盖汽车智能化、工业数字化、SaaS和海外科技,于2021年2月加入国信证券。


黄浩峻

        联系人


加州大学伯克利分校工学硕士,清华大学工学硕士,重点覆盖智能驾驶、工业软件、数据库等板块。


国信证券经济研究所


深圳

深圳市福田区福华一路125号国信金融大厦36层

邮编:518046

总机:0755-82130833

上海

上海浦东民生路1199弄证大五道口广场1号楼12楼

邮编:200135

北京

北京西城区金融大街兴盛街6号国信证券9层

邮编:100032


相关阅读

  • 芯片专家交流纪要

  • 公众号改了规则,推送不按时间顺序,若不想错过文章,请设置“星标”,顺手点下“再看”,下次更新优先推送消息;欢迎点赞、在看;内容来源于网络,若不便发表,请联系后台删除;文章仅用于研究
  • 广联达纪要

  • 公众号改了规则,推送不按时间顺序,若不想错过文章,请设置“星标”,顺手点下“再看”,下次更新优先推送消息;欢迎点赞、在看;内容来源于网络,若不便发表,请联系后台删除;文章仅用于研究
  • 罕见!头部券商收到警示函,原因竟是这个…

  • 券商与第三方平台合作的消息不断。3月27日,北京证监局发布了《关于对中信建投证券股份有限公司采取出具警示函行政监管措施的决定》(下称《决定》)。《决定》称,中信建投对经纪
  • 一位 AI 画家的成长历程丨TECH TUESDAY

  • 都是 AI 文生图,为何差别这么大。文丨贺乾明编辑丨龚方毅在电脑上输入几个词,等着在屏幕上看到它们被转化成图片,比如山川湖海、鸟兽鱼虫、楼宇院落、人物肖像。不管效果如何,都

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • GPT机器人要来了?OpenAI进一步跟马斯克对抗

  • OpenAI联合创始人阿尔特曼和马斯克之间的相互攻击越来越多,正如见闻君此前提及的,他们之间的恩怨可以追溯到8年前。现在看来,他俩之间恐怕“好戏才刚刚上演”。OpenAI进军特斯
  • 币圈风暴再起!美国出手打击币安和赵长鹏

  • 币圈监管风波再起,全球最大加密货币交易所币安遭起诉。美东时间3月27日,美国商品期货交易委员会(CFTC)对币安以及其创始人兼CEO赵长鹏提起诉讼,指控其为了寻求高速增长提供违法衍