史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

1,559次阅读
没有评论

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

之前要两天才能训练好的数字人,现在只用半小时就能完成了!

到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频

而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

这正是由苹果联合德国马普所推出的,基于高斯函数的3D数字人合成工具HUGS

它可以从一段简单的视频当中提取出人物骨骼,从而合成数字分身并驱动它做出任意动作。

这个数字人可以丝滑地融合到其他场景,甚至帧率还能超越原始素材,达到60FPS。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

Hugging Face的“首席羊驼官”Omar Sanseviero看到后,也给HUGS送上了hug。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

那么,HUGS可以实现怎样的效果呢?

100倍速生成60FPS视频

从下面这张动图可以看出,新生成的数字人可以在不同于训练素材的场景中做出不同的动作。

而新合成的画面也比原始素材更加流畅——尽管原素材只有24FPS,但HUGS合成的视频帧率达到了60FPS。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

同时,HUGS也支持把多个人物融合进同一个场景。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

细节刻画上,HUGS也比Neuman和Vid2Avatar这两个前SOTA更清晰细腻,也更加真实。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

如果放到规范空间中,Neuman和HUGS的细节对比将变得更加明显。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

测试数据上看,HUGS在NeuMan数据集的五个场景中的PSNR和SSIM评分都达到了SOTA水平,LPIPS误差则处于最低位。

在ZJU Mocap数据集上,针对5个不同受试者,HUGS也都超越了NerualBody、HumanNeRF等Baseline方法。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

速度方面,HUGS的训练只需半小时就能完成,而此前最快的VidAvtar也要48小时,速度提升了近百倍。

渲染速度也是如此,用Baseline方法进行渲染需要2-4分钟,但HUGS只用16.6毫秒就能完成,比人眨眼的速度还快。(下图为对数坐标系)

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

那么,HUGS是如何实现既迅速又细腻地生成3D数字人的呢?

像搭积木一样渲染

HUGS首先将人物和场景分别转化为3D高斯斑点

其中,人物部分的高斯斑点由三个多层感知机(MLP)来预测,并通过SMPL(一种人体形状模型)进行初始化。

SMPL可以用极少的参数建立实体人物到三维网格的映射,只需要10个主要参数就可以表示99%的人体形状变化。

同时,为了刻画头发和衣服等细节,HUGS也允许高斯函数在一定程度上偏离SMPL。

场景的高斯斑点通过特征三平面提供的位置编码,由多个MLP预测得到。

得到人体和场景模型的高斯斑点后,研究者对它们进行了联合优化

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

得到的高斯斑点还会被进行克隆和拆分,从而增大斑点密度,不断接近真实的目标几何表面,这一过程称为Densify

此外,研究人员还引入了线性混合动画(LBS)技术,在运动过程中对高斯斑点进行驱动。

转换为高斯斑点形式后,研究人员训练了神经网络对高斯函数的属性进行预测,形成真实的人体形状。

同时,神经网络还定义了高斯函数与人体骨骼的绑定关系,从而实现人物的运动。

这样,HUGS的渲染过程就像搭积木一样,不需要重新调用神经网络,从而实现了高速渲染。

消融实验结果表明,LBS、Densify和三平面MLP都是HUGS中的重要环节,缺少任何一个都会对合成效果造成影响。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

而人物与场景的联合优化,同样是实现刚好融合效果的关键因素。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

One More Thing

苹果产生研究数字人的想法已经有一段时间了。

在苹果MR头显Apple Vision Pro中,就出现过高细节版本的数字分身概念——

在FaceTime通话时,头显可以创建一个“数字人”,并用它来代表用户。

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

那么,对苹果的这个“数字人生成器”,你怎么看呢?

论文地址:
https://arxiv.org/abs/2311.17910
参考链接:
[1]https://appleinsider.com/articles/23/12/19/apple-isnt-standing-still-on-generative-ai-and-making-human-models-dance-is-proof
[2]https://twitter.com/anuragranj/status/1737173861756485875/

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...