服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

一句话拍大片,导演末日来了!Gen-2震撼发布,科幻日系二次元统统拿捏

日期: 来源:新智元收集编辑:新智元



  新智元报道  

编辑:Aeneas 好困
【新智元导读】Runway的Gen-1还没内测完,Gen-2就以迅雷不及掩耳之势发布了。这次的效果更加炸裂,AI大导离淘汰人类,又近了一步。

昨天,Midjourney生成的完美情侣刷爆网络,大家纷纷在留言区里畅想,下一步,就是演员被淘汰,人人都能升级大导,一键生成大电影了。
巧得很,今天,会做视频的AI模型不就来了嘛。
刚刚,仿佛一声惊雷炸响,Runway发布了文字生成视频模型Gen-2。
宣传词也是非常炸裂——「say it,see it」,只要你说得出来,它就能给你做出来。科幻小说里的超能力成真了!
可以说,有了Runway Gen-2,你就能用任意的图像、视频或文本,生成一段酷炫大片,想要啥风格,就有啥风格。
这个速度简直让人目瞪口呆:Gen-1的内测都还没拿到呢,Gen-2就来了!

一句话,一张图,三秒视频无中生有

此前,Runway在文本到图像领域就曾经大放异彩,大名鼎鼎的Stable Diffusion,就是Runway开发的。
在今年2月,Runway就提出了首个AI编辑模型Gen-1。
顾名思义,Gen-1可以在原视频的基础上,编辑出咱们想要的视频。无论是粗糙的3D动画,还是用手机拍出来的摇摇晃晃的视频,Gen-1都可以升级出一个不可思议的效果。

论文地址:https://arxiv.org/abs/2302.03011
比如用几个包装盒,Gen-1就可以生成一个工厂的视频,化腐朽为神奇,就是这么简单。
而相比Gen-1,Gen-2获得了史诗级的升级——可以从头开始生成视频。
目前,这个模型还未开放,预计在几周内会公开。
而根据目前的演示片段看来,Gen-2的效果似乎暂时比不上Gen-1,没有那么逼真。
但是,这毕竟是AI文生视频0到1的第一步。AI导演做到这一步,已经够人类颤抖的了。

网友实测,效果炸裂


而获得内测资格的幸运网友,已经开始动手生成自己的电影了。
可以看出,无论是宫崎骏风格的日系动画,还是写实风格的镜头特写,或者魔幻特效的电影大片,Gen-2都不在话下。
虽然目前的画质可能还不够细腻,但毕竟是从0生成的视频,一旦日后优化好,大导们的饭碗怕是捧不稳了。

Gen-2的八大「魔法」


Mode 01:Text to Video(文字生成视频)

一个文本提示,就能合成出任意风格的视频,不怕它生不出来,只怕你想不到。

提示:

在纽约市的一间阁楼里,傍晚的阳光透过窗户温柔地洒进屋内。

输出:

Mode 02:Text + Image to Video(文字+图像生成视频)

输入一幅图,再加一句prompt,直接就给你变成了视频。

输入图像:

驱动提示:

在一个低角度拍摄的画面中,男子正沿着街道行走,周围酒吧的霓虹灯照亮了他的身影。

输出:

Mode 03:Image to Video(图像生成视频)

这个不用解释了,你给它一张图片,它给你秒变一段视频。多种风格,随你选择。
美图一秒变电影,这也太梦幻了吧。

输入图像:

输出:

Mode 04:Stylization(风格化)

如果你有一段原视频,但是效果不够炸裂,怎么办?
只需要把你想要叠加的风格用图片或者文字叠加上去,多魔幻的风格都立马生成,秒变好莱坞大片。

原始视频:

驱动图像:

输出:

Mode 05:Storyboard(故事版)

将模拟的场景一拉,就变成了风格化和动画化的渲染图,前期制作一键简化。

输出&输出对比:

Mode 06:Mask(掩码)

在你的视频中分离出特定的对象,然后通过prompt,想怎么改就怎么改,比如下图中,金毛秒变斑点狗。

输入视频:

驱动提示:

一只身上有黑色斑点的白毛狗。

输出:

Mode 07:Render(渲染)

只要输入图像或提示,无纹理的渲染立马变成现实的输出,深度和真实感震撼人心。

输入视频:

输出:

Mode 08:Customization(个性化)

通过自定义,让原视频个性化大变身,保真度还超高。
点击就看外国小哥秒变海龟人。

输入&输出对比:

训练图像:

从生成结果来看,Gen-2的前景,实在是太令人着迷了。(Gen-1的内测申请在这里,http://t.cn/A6Cu1cdy)。
虽然Meta和谷歌也有类似的文本到视频模型(Make-a-Video和Phenaki),生成的剪辑更长、更连贯。
但这些体量更大的公司并没有投入多大的资源,相比之下,Runway的团队只有区区45人。
其实,Runway自2018年以来,就一直专注于研究AI工具,并在去年年底筹集了5000万美元。
有趣的是,Stable Diffusion的初始版本,就有Runway的贡献。只不过后来被Stability AI普及,并有了更进一步的发展。
而这也告诉我们,初创公司在生成式AI上的潜力,是多么惊人。

一大波展示

提示:一只眼睛的特写镜头

提示:无人机拍摄的沙漠景观

参考资料:

https://research.runwayml.com/gen2

https://www.theverge.com/2023/3/20/23648113/text-to-video-generative-ai-runway-ml-gen-2-model-access





相关阅读

  • 博客14周年:博客这一年工作汇报

  • 2022年我一直践行着一句话:当你的业务模式在盈利的时候,就说明你当前的团队、产品什么都没问题,不要瞎折腾。卢松松博客也是如此。当一个平台进入到成熟稳定期后,就尽量少折腾。
  • 5G语音现在什么样了?

  • 资料来源:中兴文档物联网智库 转载导读5G发展至今,已经从基础建设期进入了加速发展期,那么5G语音现在什么样了?5G时代,实时通信仍然是不可或缺的基本业务能力。5G发展至今,已经从
  • 微信底栏新增“视频号”入口?

  • 近日,腾讯公司公关总监张军发布消息,否认网传的微信底栏新增“视频号”入口截图。从这一网传截图可以看到,微信底栏出现了第五个按钮“视频号”,且被放在了正中间。张军表示:“今
  • 【人人乐业】职场|持续学习提升自我三部曲

  • 关注乐业上海了解更多本市就业服务信息案例背景霍麟(化名)是一名学历较低求职青年,在一家传媒公司有过长达7年的视频剪辑工作经验,但在去年由于疫情等种种原因离职待业了一段时

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 国际锐评|“美式民主”荼毒的岂止伊拉克

  • “战后的混乱证明伊拉克战争从一开始就是一个错误,是一场灾难。”当地时间20日,美国《大西洋周刊》网站发表评论称。前两天,数百名反战人士在白宫北侧拉斐特广场举行集会。他们
  • 带这么多不能惯

  • 近日,大连周水子机场海关关员在对进境航班旅客行李物品进行监管时,发现两名同行旅客的行李中有大量首饰、手表和化妆品等。经开箱查验,现场查获超量携带未申报首饰、手表、化妆
  • 湖南最新发布!举报这些违法行为,有奖!

  • 为鼓励公众积极参与生态环境监督管理,致力形成打击生态环境违法犯罪合力,构建生态环境保护社会共治大格局,近日,省生态环境厅出台《湖南省生态环境问题线索举报奖励办法(试行)》(以
  • 国务院最新任免

  • 国务院任免国家工作人员。任命李松为常驻联合国工业发展组织代表、常驻国际原子能机构代表。免去吴江浩的外交部部长助理职务;免去王群的常驻联合国工业发展组织代表、常驻国
  • 100万!湖南这所高校将悄悄给学生打钱

  • 湖南高校又放资助“大招”!100万餐费将偷偷打进学生的餐卡里。湖南科技大学近日发布消息,将根据全校全日制学生(含本科生、研究生、留学生)在食堂的就餐消费大数据,无需申请,对在