服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

Sora横空出世,A股哪些公司有布局?

日期: 来源:奔流新闻收集编辑:奔流新闻

人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。

OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐对其进行转换生成视频。Sora能够一次生成整个视频或扩展生成的视频以使其更长。通过一次为模型提供多个帧的预见,OpenAI解决了一个具有挑战性的问题,即确保主题即使暂时离开视野也保持不变。

与GPT模型类似,Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更精准遵循生成用户的文本指令。

OpenAI表示,Sora是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现AGI(通用人工智能)的重要里程碑。

券商建议关注多模态技术

Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。

其实,Sora出现之前,也有其他类似的AI视频模型。比如,谷歌在去年12月21日发布一个全新的视频生成模型VideoPoet,能够执行包括文本到视频、图像到视频、视频风格化等操作。Meta则有名为Emu的模型。此前一夜爆红的文生视频软件Pika更掀起了AI视频应用热潮。

浙商证券认为,短期内,Sora及同类产品可大幅提升图像和短视频的制作效率,改变创意生产及营销工作流,提升短视频产品生产力,对于业态更加复杂的长视频和游戏,受限于模型目前还无法很好理解因果关系,和其他技术难点,现阶段或以提供美术灵感支持为主。中长期来看,Sora及同类产品将参与到改变信息生产和分发两大环节的进程中,PGC(专业生产内容)将广泛采用AI工具辅助生产,UGC(用户生产内容)将借助AI工具逐步替代PGC。此间,AI生成视频工具的商业化将提速,目前Sora还未公布收费标准,参照之前Runway等文生视频工具收费情况,定价相对较高。鉴于Sora采用的世界模拟器技术路径,边际成本或有降低的可能。

浙商证券列出的下游应用侧,从相关受益细分行业来看,包括但不限于视频美化、广告营销、短剧、游戏、办公软件等。具体到投资标的,建议关注美图公司(1357:HK)(视觉大模型+大DAU图像应用)、中文在线(300364)(短剧出海+IP)、阅文集团(0772:HK)(IP)、金山软件(3888:HK)、三人行(605168)等;上游增加需求来看,推荐关注英伟达等算法、算力方面标的。

东方证券早前的报告认为,从技术突破的角度来看,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。因此,基于多模态的应用场景仍需不断探索,AI视频生成仅仅是多模态技术路径中的一个小方向,多模态领域的ChatGPT时刻还未到来。

东方证券建议关注海康威视(002415)、大华股份(002236)、萤石网络(688475)、中科创达(300496)、虹软科技(688088)、科大讯飞(002230)、万兴科技(300624)等公司。

中泰证券研报指出,跨时代文生视频模型,有望推动硬件需求进一步提升。Sora基于图片做长视频生成,再基于生成视频做extend,其所需token(文本处理最小单位)数量相较于文本及图片模型的推理,有望呈数量级增长,判断Sora将刺激推理算力需求将持续上升。此外,推理端token增加、算力需求的增长,也对显存及带宽提出更高要求,预计将拉升400G光通信技术在以太网中的应用,并有望推动800G乃至1.6T光通信技术的应用。

哪些A股公司有布局?

据不完全统计,已有十多家A股上市公司之前已经布局多模态大模型或对AI视频相关研发。

海康威视(002415)在去年4月20日回复投资者提问时披露,公司从几年前就开始研发视觉大模型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。

大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、图像等输入,构建了多模态融合的行业视觉大模型。

大华股份在1月15日在投资者问答中介绍,公司多模态融合的行业视觉大模型(大华星汉大模型),是基于公司过去丰富的行业和细分场景的业务经验,面向以视觉为核心的智慧物联领域,通过融合图像、点云、文本、语音等多模态数据所搭建的,大幅提升了视觉解析能力,该模型为解析式大模型,与市面上的ChatGPT等生成式大模型有明显差异。

万兴科技(300624)此前发布音视频多媒体大模型万兴“天幕”。据了解,万兴“天幕”是一个以音视频生成式AI技术为基础的多媒体创作垂类大模型,由视频大模型、音频大模型、图片大模型、语言大模型组成,聚焦数字创意垂类创作场景。

2月2日,万兴科技在互动平台表示,天幕大模型主要基于公司在数字创意领域二十年的产品开发与运营经验而打造的音视频多媒体大模型,具备多媒体、垂直解决方案、算力数据及应用本土化等特色,以更智能、更沉浸的功能效果和产品体验赋能全球内容创作者的创意表达。

博汇科技(688004)1月9日在回复投资者提问时表示,公司通过运用人工智能、大数据等技术,对采集到的数据进行分析、特征学习和样本训练,构建智慧监管模型,提升了对文本、图片、音频、视频等多模态数据的处理分析能力,进一步强化核心技术优势,提高产品竞争力。

易点天下(301171)在2月4日在投资者互动平台表示,公司旗下AIGC创作平台KreadoAI可以帮助企业实现从脚本撰写、语音克隆、个性化数字人选择到输出口播视频的内容生产AI化全链路闭环。

数码视讯(300079)1月4日互动平台表示,公司多年来积极自主研发积累AI技术,尤其是在视频内容生产领域,持续不断探索AIGC生成式技术,并配合智能审核技术、多模态智能搜索等实现全媒体行业的媒资管理,构建全新视音频服务。

汉王科技(002362)2023年12月31日互动平台表示,公司在文本、图像、视频、生物特征、语音等多样态识别、文本理解和利用等技术上耕耘多年,并形成智能终端产品和行业解决方案。目前正在研发的AI模型尚属于新生技术,在文本生成、生成内容的控制与审核等方面的技术细节尚在进一步完善。

当虹科技(688039)1月5日互动平台表示,公司拥有自研的AIGC工具集,发布了以静态照片生成三维体积视频的方案,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。公司AIGC视频内容智能生成系统融合了大模型技术,能助力用户在新闻传播、视频内容创作等多项领域中创作出优质视频内容。

东方国信(300166)去年12月27日互动平台表示,在AI多模态方面,公司在文本、语音、图像、视频等非结构化数据类型的AI分析上,均有应用产品和落地案例。视觉类有基于Stable Diffusion的图像生成能力,其他视觉类大模型应用还在探索技术路径和应用场景。

神思电子(300479)2023年12月26日在互动平台表示,公司经过多年人工智能领域积累,已突破了远距离全天候复杂场景激光热成像联动入侵检测技术,掌握了基于深度学习的非结构化数据处理、视频分析、语音对话、知识管理以及云平台技术。公司正在对于文生图、图生文、视频生文、文生视频等多模态数据互相跳转的收敛性质进行研究,支撑培训、检索、推荐、目标追踪等多个场景的生成式大模型应用。

因赛集团(300781)2023年12月25日在互动平台表示,公司InsightGPT具备文生文、视频智能剪辑、图生视频等功能,目前正在开发文生视频功能。在现有图生视频等技术框架下,InsightGPT目前可生成20秒以上的视频。在目前文生视频的逻辑流程中,InsighGPT先结合图像、视频大模型,融合抠图等多种算法,再结合音频模型,整体渲染后最终合成完整视频。

拓尔思(300229)2023年12月14日在互动平台表示,公司在Transformer架构方面积极跟踪业内最新技术,未来将根据技术研发和业务需求的实际情况,适时采用类似架构。

国脉文化(600640)去年12月12日在互动平台表示,公司在文生视频方面,已内部开发基于大模型的AIGC数字内容生成平台,平台利用多模态技术,使用自有的版权内容,生成文字、音频、图片、视频等影视素材,进行内容的创作生产,正在内部试用中。

佳都科技(600728)在2023年12月11日在互动平台表示,公司TransCorc-M多模态大模型能够理解立本、图像、视频等多种模态的信息,并且按照用户需求将其进行描述、提示或转化为指令代码,是个非常“聪明”的交通信息小助手。

来源丨澎湃新闻(记者 周玲 吴遇利)(版权归原作者所有,如有侵权请联系删除)


相关阅读

  • OpenAI新年开出王炸,AI竞争升级

  • 来源 | 伯虎财经(bohuFN)作者 | 陈平安OPEN AI又刷屏了。2023年年初,OPEN AI就曾引爆全球科技圈。因为其发布了一个全新的聊天机器人模型—— ChatGPT。和过去那些简单的聊天机
  • 探路高校数字化人才队伍建设

  • 伴随信息技术的快速迭代,近年来,高校信息化工作发展规模与人才队伍的匹配度逐渐降低。相关研究表明,高校现有的信息化队伍已经无法适应当前业务单位对信息化的诉求。与此同时,基
  • 江苏海安一公司发生爆炸致3死2失联

  • 极目新闻记者 丁鹏 张奇据央视新闻报道,2月18日凌晨,江苏省海安一公司车间内生产铝棒的铸造井区域发生爆炸。截至目前,共造成3人死亡,2人失联,搜救和善后工作正在进行中。18日,当
  • 冠军AI形象创作实例29:武术亚运冠军童心

  • 图文创作:司继庆AI自2023年火爆之后,迅速收获了大量眼球。将这一最新技术,与奥运冠军和世界冠军相结合,创作出一种全新风格的冠军形象,更好地推动体育运动和全民健身。这个想法,
  • 名单 | 广东省2023年高新技术企业

  • 各地级以上市科技局(委),各地级以上市、横琴粤澳深度合作区财政局,国家税务总局广州、各地级市、横琴粤澳深度合作区税务局,各有关单位:根据《科技部财政部国家税务总局关于修订印
  • 兰州大学剪纸贺新春!

  • 新年新气象,兰大艺术学院的学生,运用剪纸实践课作品,祝兰州大学新年快乐,祝兰大老师、同学和职工人员龙年大吉。在新的一年,阖家欢乐,幸福美满,平平安安。接下来,请大家一起欣赏剪纸
  • OpenAI的视频生成模型Sora令影视业倍感惶恐?

  • 图片来源:视觉中国北京时间2月16日凌晨,没有任何预告,全球明星AI创业公司OpenAI发布了文生视频模型Sora,首次由AI生成了长达1分钟的多镜头长视频,其对于真实人类世界的高模拟度画
  • 短视频丨“小雪团”向前冲

  • ▌制作:国立友 徐继岩 部分视频来源:官方媒体平台编辑:薛冰编审:赵宗杰 张革终审:李恩广 雷建军总监制:肇慧茹

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • Sora横空出世,A股哪些公司有布局?

  • 人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成
  • 雨水丨等一场春雨 迎一路春色

  • 一场雨,飘飘洒洒,如诗如梦在春雨的沁润下草木抽出嫩芽大地一派欣欣向荣的景象2月19日,雨水春天的第二个节气让我们在诗词美句中触摸雨水时令的无尽温柔在如画美景中感受祖国大
  • 用坚守书写最美“敬业福”

  • 春节期间,位于郑州市上街区的中铝物流集团中部国际陆港有限公司(简称中部陆港)本部,以及所属宁夏固原中部陆港六盘山铁路公司、中铝物流华东仓储中心无锡南库等区域,中部陆港的干
  • 这是返乡大学生的主场!

  • 春节期间,由县文化和广电旅游体育局主办的2024“迎新年”象山北纬30度大学生运动嘉年华,开展了帆船体验、乒乓球、篮球和羽毛球等一系列赛事活动。  其中,“贺岁杯”象
  • 商南“四好农村路”铺就康庄大道

  •   公路总里程2707.9公里,基本形成以县城为中心的“四横两纵、两大迂回、内联外畅、阡陌纵横”的公路网络,让广大群众走上了放心路,县城到最远的村由原来的4小时缩短至现在的2