服务粉丝

我们一直在努力
当前位置:首页 > 情感 > 故事 >

ControlNet作者新项目爆火:仅一张图生成25秒绘画全过程!

日期: 来源:量子位收集编辑:量子位

西风 发自 凹非寺 量子位 | 公众号 QbitAI

ControlNet作者张吕敏(Lvmin Zhang)又又又发新作了!

输入任意一张图,分分钟就能“拆解”成一个25秒的图像绘制过程视频:

从线稿到填色还有局部细节调整,全都有的那种:

而且不止动漫风,各种风格都能驾驭:

这个项目名为Paints-Undo,发布不到24小时,GitHub上已揽星600+:

网友们针对它的讨论也经历了一轮又一轮,不少人纷纷表示“这个是真牛P”。

……甚至因为效果太好,遭到网友吐槽:

手绘伪造成本又低了。

还有不少网友已经玩上了:

Ctrl+ZZZZZZZ

据GitHub主页上的介绍,Paints-Undo的命名有“其绘制过程就像是在绘画软件中多次按下撤消(Undo)按钮”之意。

该项目包含一系列模型,展示了各种人类绘画行为,比如素描、勾线、上色、阴影、变形、左右翻转、调整色彩曲线、改变图层透明度,甚至在绘画过程中改变整体想法等等。

目前发布了两个型号:paints_undo_single_frame和paints_undo_multi_frame。

paints_undo_single_frame为单帧模型,基于SD1.5架构进行了改进,输入为一张图和一个operation step,并输出一张图。

operation step相当于Ctrl+Z(撤销)多少次,比如operation step为100,就相当于会得到一张Ctrl+Z 100次的效果图。

paints_undo_multi_frame是多帧模型,基于VideoCrafter打造,但没有使用原始Crafter的lvdm,所有的训练/推理代码都是从头开始完全实现。

经过训练后,多帧模型整体架构类似于Crafter,包含5个组成部分:3D-UNet、VAE、CLIP、CLIP-Vision、Image Projection。

多帧模型输入为两张图片,输出是这两张图片之间的16帧中间帧,其结果比单帧模型更加一致,但也更慢,创造性较低。

代码库默认方法是将两个模型一起使用:

首先使用单帧模型获取5-7个“关键帧”,然后使用多帧模型来“插值”这些关键帧,最终生成一个相对较长的视频。理论上甚至可以生成无限长的视频,但在开发测试中帧数为100-500时,结果较好。

可以通过以下方式在本地部署:

介绍中还提到,项目测试是在24GB显存的Nvidia 4090和3090TI上进行。理论上说,16GB的显存应该也够用,但8GB就不行了,最少需要大概10到12.5GB的显存。

根据不同配置,处理一张图大约需要5-10分钟。

生成视频时长25秒,帧率为4FPS,分辨率可能是320x512、512x320、384x448或448x384。

更多玩法展示

除了直接生成25秒的从线稿到上色的视频,还有其它玩法。

比如输入线稿,也能生成线稿绘制过程:

单输入多输出也可以:

或者还可以从一张图提取出不同精细程度的线稿:

插入一张线稿,直接在此线稿基础上填色也行:

感兴趣的家人们可以亲自动手试试~

GitHub链接:https://github.com/lllyasviel/Paints-UNDO

相关阅读

  • WAIC 2024 | “智”领未来,我们带来这些创新应用

  • 近日,2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC”)在上海举办。大会围绕核心技术、智能终端、应用赋能等三大板块,聚焦大模型、算力、机器人、自动驾驶等重
  • 多模态大模型引领的内容创作与安全实践

  • 作者:薛从豪:中科闻歌市场品牌部总监;王一刚:中科闻歌副总裁;彭佳柱:中科闻歌媒宣事业部总监;陈思含:中科闻歌政企事业部总经理;魏坚:福建省福清市政协委员服务中心干部来源:《全媒体探
  • 大模型时代传媒行业的变革与前行

  • 作者:徐泽民:传播大脑科技(浙江)股份有限公司大模型算法专家;张健:传播大脑科技(浙江)股份有限公司副总经理兼首席技术官来源:《全媒体探索》2024年6月号摘 要:大模型技术的出现
  • 人工智能赋能新型工业化步伐提速

  • 淄川融媒信息 2024中国互联网大会7月9日在京开幕。当前国产大模型产品不断涌现,相关部门将进一步推动人工智能赋能新型工业化,加快人工智能领域关键核心技术攻关,加快培育行业
  • 全国首个AI退役军人事务员“武小凯”上岗

  • 极目新闻记者 陈倩通讯员 陈凯有问必答,还能作诗。7月8日,武汉“戎耀”军创大模型成果推介会在武汉市退役军人之家举办,基于该大模型生成的全国首个AI退役军人事务员“武小凯”
  • “智能体”成了最热AI词汇

  • 人们观看松延动力人形机器人奔跑 新华社发羊城晚报全媒体记者 沈钊2024世界人工智能大会(WAIC)刚刚在上海落下帷幕,羊城晚报全媒体记者在大会现场看到,无论是对前沿科技的探索,还

热门文章

  • 2·14 “婚育户”一次办

  • 2月14日,沈阳的张先生和五莲县的丁女士握着手中的“红本本”,脸上是抑制不住的喜悦,这一天,他们不仅成为合法夫妻,更成为“婚育户”联办业务的新人。说起这项业务,张先生夫妇高兴

最新文章

  • 12306紧急回应!

  • 近日,某平台推出火车票全网“免费退”和“专享火车票无忧退”活动。这些做法纯属该平台吸引新会员的营销炒作,误导消费者以为火车票退票免收退票费。现行火车票退票费规定是什