找回密码
 立即注册
搜索
查看: 4521|回复: 22

[科技] 阿里这篇有关与ai绘画生成的Animate Anyone如何?

[复制链接]
发表于 2023-12-3 10:29 | 显示全部楼层 |阅读模式
本帖最后由 BISSBISS 于 2023-12-3 10:29 编辑

https://www.bilibili.com/video/av536618308
看起来好像很强阿、
回复

使用道具 举报

     
发表于 2023-12-3 10:32 | 显示全部楼层
实际效果能有演示的一半不
回复

使用道具 举报

     
发表于 2023-12-3 10:37 | 显示全部楼层
想一下,这种实时同步神经网络架构的算力要求应该很大....盲猜应该是结合了LCM或者turbo技术?
但是视频里用的是pose控制现在用的很少,主要POSE对人体一些动作识别度不高....,对于AI技术我的观点是,落地再说...另外为啥是MJ的标签?
回复

使用道具 举报

     
发表于 2023-12-3 10:39 | 显示全部楼层
reddit上备受期待的项目,真有视频那么厉害那以后就是全民管人的时代了。
回复

使用道具 举报

     
发表于 2023-12-3 10:43 | 显示全部楼层
freedomkought 发表于 2023-12-3 10:37
想一下,这种实时同步神经网络架构的算力要求应该很大....盲猜应该是结合了LCM或者turbo技术?
但是视频里用 ...

没说是实时的啊,应该是给它一张图和一组pose动作帧然后让图里的人物按照pose动起来
回复

使用道具 举报

     
发表于 2023-12-3 11:00 | 显示全部楼层
处男鉴黄师 发表于 2023-12-3 10:43
没说是实时的啊,应该是给它一张图和一组pose动作帧然后让图里的人物按照pose动起来 ...

看了下抱脸上的原理解释,的确没提到实时这个,被误导了....
看解释是用了包括三种算法模型提高角色专一度,用了类似temporalnet和其他两种算法模型提高对角色一致性,不过隔壁temporalnet似乎2代最近的模型修剪版也接近6个G的大小了......看抱脸和GITHUB上似乎还没开源,等阿里开源再说,企鹅那堆控制模型之后我对国内的此类开源已经抱怀疑态度了..
回复

使用道具 举报

     
发表于 2023-12-3 11:01 | 显示全部楼层
泥潭终于有人搬了吗,这个展示效果有点卖家秀的味道了,好的难以置信
回复

使用道具 举报

     
发表于 2023-12-3 11:12 | 显示全部楼层
本帖最后由 SinoWarrior 于 2023-12-3 11:21 编辑



看下他这个结构就知道了,和ControlNet(TemporalNet也是ControlNet)是不一样的,他这个结构更复杂,而且是对pose加噪(ControlNet是依托于对图片加噪训练的Latent Diffusion)
ReferenceNet和动作加噪的UNet是做的spatial attention然后再和CLIP提取的语义特征做Cross Attention,ControlNet相当于两个直接做Cross Attention(没有CLIP语义特征)

看他们说的训练也分成两步,第一步是用单帧训练动作降噪Unet和ReferenceNet,第二步是基于AnimateDiff的参数单独训练 temporal layer。第一步出单图,第二步出视频

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2023-12-3 11:14 | 显示全部楼层
这个看起来挺不错啊,动作流畅持续性也好
回复

使用道具 举报

     
发表于 2023-12-3 12:53 | 显示全部楼层
为啥第一想到的是会被用于aigc的视频电信诈骗…
回复

使用道具 举报

     
发表于 2023-12-3 13:05 来自手机 | 显示全部楼层
这个是数字人的技术
回复

使用道具 举报

     
发表于 2023-12-3 13:41 | 显示全部楼层
虽然动作还很单调,但速度足够快的话只要比目前的L2D好就有使用场景,我一直觉得L2D那么僵硬,动态和静态也没什么差别吧……其实不然,僵硬的动态也是有很多观众的。
回复

使用道具 举报

     
发表于 2023-12-8 02:19 | 显示全部楼层
还没等阿里发布代码和模型,字节先截胡了
关键词MagicAnimate
回复

使用道具 举报

     
发表于 2023-12-8 02:32 | 显示全部楼层
处男鉴黄师 发表于 2023-12-8 02:19
还没等阿里发布代码和模型,字节先截胡了
关键词MagicAnimate

从演示来说字节那个比这个差的有点多
这玩意从论文出来到现在,空空如也的github已经上万star了
回复

使用道具 举报

     
发表于 2023-12-8 02:41 | 显示全部楼层
等一键包
回复

使用道具 举报

     
发表于 2023-12-8 03:05 | 显示全部楼层
处男鉴黄师 发表于 2023-12-8 02:19
还没等阿里发布代码和模型,字节先截胡了
关键词MagicAnimate

字节那个明显是一看被抢先了赶紧发布的

就和当时被Controlnet抢先一步之后腾讯赶紧发了个T2I,效果也很烂
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-12-8 03:32 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-12-8 03:34 | 显示全部楼层
搞 live2d / spine 的叫什么师来着
回复

使用道具 举报

     
发表于 2023-12-8 06:44 来自手机 | 显示全部楼层
whzfjd 发表于 2023-12-8 03:34
搞 live2d / spine 的叫什么师来着

你猜为什么游戏要用骨骼动画而不是序列帧?
回复

使用道具 举报

     
发表于 2023-12-8 09:10 | 显示全部楼层
以后视频也能PS了
回复

使用道具 举报

     
发表于 2023-12-8 10:10 | 显示全部楼层
你就说多大显存吧
回复

使用道具 举报

     
发表于 2023-12-9 13:49 | 显示全部楼层
感觉还行 就是densepose比较非主流找不到多少素材可用

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
千千千千鸟 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2023-12-9 18:54 来自手机 | 显示全部楼层
本帖最后由 TYAO 于 2023-12-9 18:57 编辑

长安三万里和异人之下数字人厘里都是阿里AI应用端的成果,还是可以比那些PPT公司有说服力

—— 来自 Xiaomi 23013RK75C, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-5-23 15:04 , Processed in 0.106977 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表