DITTO-NeRF:基于扩散模型的迭代式文本到三维图形全方位生成算法,支持尺度、角度、掩码三要素

869次阅读
没有评论

DITTO-NeRF:基于扩散模型的迭代式文本到三维图形全方位生成算法,支持尺度、角度、掩码三要素

对于高质量3D内容创作的需求越来越大,促进了从单张图像和/或文本提示创建3D对象模型的自动化方法的发展。然而,使用最先进的图像到3D方法重建的3D对象仍然在给定图像上表现出低对应性和低多视角一致性。最近的最先进的文本到3D方法也存在局限性,每个提示产生的3D样本具有很少的差异,并具有长时间的合成时间。为了解决这些挑战,我们提出了DITTO-NeRF,一种从文本提示或单张图像生成高质量3D NeRF模型的新型流水线。我们的DITTO-NeRF包括使用给定的或文本生成的二维图像从正面视角构建高质量的部分3D对象,然后通过修补潜在的扩散模型迭代地重建其余的3D NeRF。在我们的DITTO-NeRF中,我们提出了逐渐递归的3D对象重建方案,包括尺度(低分辨率到高分辨率)、角度(最初是IB角度到后来的外边界(OB))和掩码(对象到背景边界),以便IB上的高质量信息可以传播到OB。我们的DITTO-NeRF在保真度和多样性方面 qualitatively 和 quantitatively 超越了最先进的方法,并且训练时间比DreamFusion和NeuralLift-360等先前的图像/文本到3D技术要快得多。

总结:

DITTO-NeRF是一种基于扩散的迭代文本到全方向3D模型的算法。它可以将自然语言文本转换为3D模型,并利用迭代过程不断提高模型的准确性和保真度。这一算法的应用领域包括视觉效果、电影制作、虚拟现实等方面。

标题:DITTO-NeRF: Diffusion-based Iterative Text To Omni-directional 3D Model

作者:Hoigi Seo, Hayeon Kim, Gwanghyun Kim, Se Young Chun

平台:https://janeyeon.github.io/ditto-nerf/

DITTO-NeRF:基于扩散模型的迭代式文本到三维图形全方位生成算法,支持尺度、角度、掩码三要素

DITTO-NeRF:基于扩散模型的迭代式文本到三维图形全方位生成算法,支持尺度、角度、掩码三要素

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy