NVIDIA再发威,可将任何视频改为慢动作播放

原标题:NVIDIA再发威,可将任何视频改为慢动作播放

虽然已经越来越多的高端单反相机和智能手机支持慢动作镜头拍摄,但这项技术依旧没有普及,例如索尼Xperia XZ2上的超级慢动作模式,每秒拍摄960帧,这是传统30帧视频数据量的32倍,这不仅需要大量的、高速的存储,而且还对处理器等硬件要求极高。

近日在美国盐湖城举行的计算机视觉和模式识别会议上,NVIDIA发布了一项新的技术,该算法可将任何视频转换成慢动作视频来播放。这项技术在工作时首先会延长帧和帧之间空缺的镜头,然后通过自主开发的机器学习算法来生成中间帧,以此达到过度平衡。

来自NVIDIA的一位科学家Merced设计了一个无监督的端到端神经网络,该网络可以生成任意数量的中间帧,已创建平滑的慢动作镜头,他们将这种技术成为“可变化的多帧插值”。

NVIDIA学习和感知团队成员Jan Kautz向外媒表示,我们计划将这项技术应用于现有的视频中,你可以减慢8倍或15倍,没有上限。

据青亭网了解,该技术的原理是:先通过一个卷积神经网络(CNN)计算光流:场景中的物体,物体表面和边缘的运动模式,然后通过预测像素在这一帧到下一帧间的变化,为每一帧生成流场。通过可预测运动的二位矢量,将这些流场融合在一起,以接近中间真的流场。

接着通过第二个CNN插入光流,进一步优化相似的流场,并预测哪部分是可见视图,以删除被遮挡的那部分像素,再来去除运动中的物体集已相关的阴影。最后,将可见性图像应用于两个帧之间,并使用中间光场和流场来达到平滑过渡的目的。

研究人员通过NVIDIA Tesla V100显卡和经cuDNN加速的Pytorch深度学习框架,对Youtube上一些240帧的视频进行了训练,包括知名慢动作博主The Slow Mo Guys等共11000个视频。

而通过这项技术生成的慢动作视频并没有出现慢动作制作软件中常见的抖动、模糊等情况,除了快速移动的物体边缘会有锯齿状情况外,很难分辨率他们是不是原本就用高速相机拍摄的。

同时,NVIDIA研究人员也讲到,这套方法能够生成单个或多个中间帧,这套模型也可应用于不同的视频场景,无需再次修改。

不过,该方案并不能快速走向商业化。Kautz表示,该系统优化并不完善,想要实时运行还存在挑战。同时他还预计,真正落地后可能会直接应用于云端。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();