服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

武汉大学凭借视频分割方向的成果问鼎国际顶尖赛事双冠军!

日期: 来源:武汉广播电视台收集编辑:武汉广播电视台

在一些修图软件上

我们可以轻松地

抠出图片中的人像

但是面对一连串运动的图像

我们该怎么办呢?

武汉大学遥感信息工程学院

有这样一个团队

就凭借视频分割方向的成果

问鼎国际顶尖赛事双冠军!

双冠王,实至名归!

视频与图像,已经越来越离不开我们的工作和娱乐生活。视频的编辑、加工与包装技术也在愈发成熟。如果在一段视频中,想把我们的人像抠出来,将背景变成武大的校园,应该怎么做呢?视频分割就在这里派上了用场。在国际计算机视觉与模式识别会议(CPVR)和计算机视觉国际大会(ICCV)两大赛事上,武汉大学遥感信息工程学院季顺平教授和2023级博士研究生张韬凭借团队在视频分割上最新的研究成果,夺得了双赛道冠军。

两项比赛均是计算机视觉与模式识别领域的顶级学术会议。国际计算机视觉与模式识别会议(CVPR)是由电子与电子工程师协会(IEEE)举办的计算机视觉和模式识别领域的顶级会议,论文录用严格,一般不超过投稿论文的30%。季顺平教授团队参加的是视频全景分割赛道,并在其中过关斩将,脱颖而出,摘得魁首。计算机视觉国际大会(ICCV)同样是计算机视觉领域的顶级学术会议之一,季顺平教授团队参加的是视频实例分割赛事。作为传承多届的老牌赛事,它荟萃了计算机视觉领域的诸多学术精英,关注长视频以及复杂视频上视频分割的性能和最新进展。

视频是图像在时域上的扩展,视频分割要在图像分割的基础上,不仅要把每一帧图片中感兴趣的目标都分割出来,而且能够在时间维度上把相同目标都正确地关联在一起。在这次的学术会议上,团队针对目前视频分割方法难以良好利用复杂长视频的持续特征的问题提出了解构的视频实例分割方法,即DVIS方法,通过图像分割、目标追踪、全局精化三个关键阶段,把一个图像中所有感兴趣的区域都给分割出来,关联主帧、利用全局信息来优化每帧,达到更好的视频分割的效果。DVIS的应用范围十分广泛,从无人驾驶需要的连续追踪、感知附近车辆、行人的位置或状态,到直播平台的视频特效,都有它的位置。

目标明确,轻松拿下!

张韬接触到VIS视觉处理系统,是在2022年五月去短视频平台实习时。基于实习期间的业务需求和此前在图像分割领域的学习,张韬决定进军视频分割领域并着手调研。那时,长视频的分割处理尚不受关注,Mask2Former-VIS是当时最为先进的技术手段。

带着对Mask2Former-VIS的一些改进成果,张韬参加了CVPR 2022的LSVOS挑战赛并拿下了第五名的成绩。也正是在这次比赛中,他们发现制约Mask2Former-VIS性能的最根本原因,即利用位置先验来一次性关联目标。在当时,张韬和小伙伴们沿着前人思路钻研,尝试设计时空交互模块来提升效率,但结果不尽人意。虽然比赛没有拿下好的名次,但也为张韬之后的研究提供了充足的经验。

“之前的技术都没法针对复杂长视频做有效处理。具体来说,就是机器获得了更多的视频信息却无法利用,导致视频分割的性能依旧是比较低的。”基于这一缺陷,张韬确立了项目的研究方向:即针对现有技术缺陷,提升视频分割技术对长视频的处理能力。为此,他查阅和分析了大量文献,认为造成这个缺陷的主要原因是:当前主流方法是通过一个端到端的网络,强行把目标分割和目标聚合这两个过程耦合在一起。“这个任务其实非常困难,根本就没有办法得到很好的学习,处理长视频的效率也会很低。”

“能不能把这件复杂的事情分开做呢?”张韬想到,既然一次性实现一个目标在所有帧上的分割和关联是很困难的,那就逐帧去做关联,只考虑相邻两帧之间的关联,然后根据局部对齐好的特征再去聚合整个视频的整体特征,最后优化每一帧上的分割结果以及它相邻帧的追踪结果。

磨刀不误砍柴工,先前实习和竞赛的积累在此刻展现出来,让他们确立了正确的研究目标,从而少走弯路,高歌猛进,最终夺冠。“季老师会为项目申请继续推进的资金,一次次把控研究的具体方向,逐字逐句地润色论文。在老师的帮助下,我们最终获得了双冠军。”张韬回忆道。

▲视频分割示意图

“未来,我们精益求精”

在未来,团队也想让他们的算法更进一步,让它有一个比较强悍的性能,可以处理真实世界无限目标、无限长度的任意的视频。“我希望可以做到随便拍一个视频,都可以用我们的技术很好地去处理。”此外,由于现在的深度学习算法都需要进行标签标注,而视频标签一般都是手工标注,不只需要像图像那样把每一帧的分割结果给标出来,还要把同一目标都关联起来,人工工作量和难度都很高。“我们正在思考如何用少量或者说不用视频标签的情况下做好视频分割的问题。”张韬说。

(来源:武汉大学微信公众号 编辑:吕艳丽)


相关阅读

  • 男子2580元学短视频剪辑运营 一个月粉丝仅47个

  • 大象新闻记者 王泽群 “谁能想到原本免费的剪辑课,最后被骗了2580元。”11月13日,57岁的无锡市民薛先生向大象新闻·大象帮求助称,他花了2580元在北京艾新高歌科技有限公司旗下
  • 2023年会活动短视频拍摄技巧

  •   年会活动不仅仅是企业公司对自己这一年的工作总结及来年计划发布的方式,也是企业宣传的重要途径,怎样利用短视频拍摄好2023年会活动的精彩瞬间呢?小编认为需要一些特定的
  • 从情感传播看地市级政务短视频号成长之路

  • 作者:杨雪松 孙九和 杨雪松:济宁广播电视台;孙九和:济宁市消防救援支队来源:《全媒体探索》2023年10月号从情感传播看地市级政务短视频号成长之路——以“济宁消防”短视频
  • 2023新雪季来啦~

  • 策划:高菲视频剪辑:关若瀛友情支持:吉林日报分发部作者:吉林日报全媒体记者 高菲 关若瀛
  • 海空突击,向战冲锋!

  • 近日,黄海某海域北部战区某护卫舰支队一场多科目实战化训练拉开战幕“方位XX、距离XX,发现不明空中目标向我近飞。”舰艇刚刚到达指定海域便接到“敌”情通报伴随着急促的警报
  • “生活降级”后,我反而过得更好了

  • 消费降级前几天,词条#一件事说明你消费降级#,登上了微博热搜,评论区很多人留言。你会发现,相比以前很多人爱炫富,如今更流行的是各种花式炫穷。关于消费降级,有人的分享扎心而现实

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 2023年度氢能专项研究课题申报评审结果公示

  • 为积极贯彻落实《氢能产业发展中长期规划(2021-2035年)》《“十四五”能源领域科技创新规划》等重点工作部署,进一步加强氢能产业链供应链发展分析研判、深化重大问题研究,2023
  • 薛亚军:扎根基层一线的安全守护者

  • 曾经的他,戎装在身,用青春和热血守卫山河远阔;如今的他,使命在肩,带着对应急管理事业的热爱,守护群众的岁月静好。他就是南通市通州区刘桥镇安全生产监督管理局局长薛亚军,从“松枝