一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

1,340次阅读
没有评论

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌一出手,又把AI视频生成卷上了新高度。

一句话生成视频,现在在名为Lumiere的AI操刀下,可以是酱婶的:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码
“阳光明媚,帆船在湖中航行”

如此一致性和质量,再次点燃了网友们对AI视频生成的热情:谷歌加入战局,又有好戏可看了。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

不止是文生视频,Lumiere把Pika的“一键换装”也复现了出来。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

左谷歌右pika,同样是选中区域一句话完成视频编辑,你pick哪一边?

让图片中静止的火焰跃动起来,也同样一选就能完成:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

还有图片转视频:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

视频风格化:

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

总之就是主打一个质量又高又全能。

更多细节,我们论文扒起~

用于视频生成的时空扩散模型

Lumiere旨在解决以往视频生成中存在的几个关键问题:

  • 真实性

  • 样化

  • 运动的连贯性

在此前的方法中,常见的做法是,扩散模型先生成一些稀疏的关键帧,而后通过一系列时间超分辨率(TSR)模型来填补关键帧之间的空白,接着再用空间超分辨率模型获取高清视频结果。

可以想见,在全局连贯性上,这样的做法存在先天的缺陷。

Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

具体来说,基于这一架构,模型能够一次性生成视频中的所有帧——这也就提升了生成视频的连贯性。

同时,因为大部分计算发生在压缩后的表示上,STU-Net能有效减少计算量,降低对计算和内存的需求。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

另外,为了提升视频的分辨率,研究人员使用多重扩散(MultiDiffusion)技术,通过线性加权空间超分辨率网络来处理重叠时间窗口带来的边界伪影等问题,从而能将生成画面融合为一个整体,得到连贯、高清的视频效果。

时长和分辨率方面,Lumiere能输出1024×1024、16fps下长5秒的视频。

研究人员提到:

5秒已经超过了大多数视频作品中的平均镜头长度。

值得一提的是,得益于时空U-Net架构端到端全帧率视频生成的能力和高效计算,Lumiere灵活可扩展,可以轻松应用到下游任务中,包括文生视频、图生视频、视频风格化、视频编辑修复等等。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码
视频修复

实验结果

研究人员将Lumiere与其他文本-视频生成模型进行了实验对比。

首先来看人类用户的判断。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

实验设计是这样的:志愿者会同时看到一对视频,一个来自Lumiere,另一个来自其他基线模型。志愿者被要求从中选出视觉质量、动态效果更好,更符合文本提示的视频。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

研究人员收集了大约400份反馈,结果显示,在视频质量、文本匹配度方面,Lumiere超越了Pika、Gen2、Imagen Video、SVD等一众顶级视频生成模型。

同时,在UCF101数据集(动作识别数据集)上,与MagicVideo、Make-A-Video、SVD等模型相比,Lumiere取得了具有竞争力的FVD和IS指标。

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

网友:谷歌,模型呢?

效果很惊艳,网友很兴奋,但桥豆麻袋……

这次,谷歌依然只放出了论文,没有试玩,更没有开源

这种似曾相识的操作,把人快整麻了:

视频很不错,但是谷歌,你又不打算发布任何代码、权重,也不提供API了,对吗?

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

还有人想起了Gemini发布时那个造假的小蓝鸭视频……

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

那么,这波你还会看好谷歌吗?

论文地址:
https://arxiv.org/abs/2401.12945
项目地址:
https://lumiere-video.github.io/#section_video_stylization

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 1 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...