阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

1,468次阅读
没有评论

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了——

这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞

例如下面这段《擦玻璃》的舞蹈视频

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

你所需要做的就是“投喂”一张人像,以及一段prompt:

一个女孩,微笑着,在秋天的金色树叶中跳舞,穿着浅蓝色的连衣裙。

而且随着prompt的变化,人物背景和身上的衣服也会随之发生改变。例如我们再换两句:

一个女孩,微笑着,在木屋里跳舞,穿着毛衣和长裤。

一个女孩,微笑着,在时代广场跳舞,穿着连衣裙般的白衬衫,长袖,长裤。

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

这便是阿里最新的一项研究——DreaMoving,主打的就是让任何人随时随地地跳舞。

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

而且不仅是真人,就连卡通动漫人物也都是可以hold住的哦~

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

项目一出,也是引发了不少网友的关注,有人在看过效果之后直呼“Unbelievable”~

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

那么如此效果,这项研究又是如何做到的呢?

背后原理

虽然像Stable Video Diffusion和Gen2等文本到视频(text-to-video,T2V)模型的出现,在视频生成方面取得了突破性进展,但现在仍然有诸多挑战需要面对。

例如在数据集方面,目前缺乏开源的人类舞蹈视频数据集以及难以获得相应的精确文本描述,这就使得让模型们去生成多样性、帧一致性、时长更长的视频成为挑战。

并且在以人为中心的内容生成领域,生成结果的个性化和可控性也是关键因素。

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

面对这两大难点,阿里团队先从数据集着手做处理。

研究者们首先从互联网收集了大约1000个高质量的人类舞蹈视频。然后,他们将这些视频分割成大约6000个短视频(每个视频8至10秒),以确保视频片段中没有转场和特殊效果,这样有利于时间模块的训练。

此外,为了生成视频的文本描述,他们使用了Minigpt-v2作为视频字幕器(video captioner),特别采用了“grounding”版本,指令是详细描述这个帧。

基于关键帧中心帧生成的字幕代表了整个视频片段的描述,主要是准确描述主题和背景内容。

框架方面,阿里团队则是提出了一个名叫DreaMoving、基于Stable Diffusion的模型。

它主要由三个神经网络来构成,包括去噪U-Net(Denoising U-Net)、视频控制网络(Video ControlNet)和内容引导器(Content Guider)

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

其中,Video ControlNet是在每U-Net块之后注入运动块(Motion Block)的图像控制网络,将控制序列(姿态或深度)处理为额外的时间残差。

Denoising U-Net是一种衍生的Stable-Diffusion U-Net,带有用于视频生成的运动块。

而Content Guider则是将输入文本提示和外观表情(如人脸)传输到内容嵌入中。

在如此操作之下,DreaMoving便可以在给定引导序列和简单的内容描述(如文本和参考图像)作为输入的情况下生成高质量、高保真度的视频。

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

不过很可惜的一点是,目前DreaMoving项目并没有开源代码。

感兴趣的小伙伴可以先关注一波,坐等代码开源了~

参考链接:
[1]
https://dreamoving.github.io/dreamoving/
[2]https://arxiv.org/abs/2312.05107
[3]https://twitter.com/ProperPrompter/status/1734192772465258499
[4]https://github.com/dreamoving/dreamoving-project

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...