Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

西风发自凹非寺
量子位 | 公众号 QbitAI

Stable Diffusion官方终于对视频下手了——

发布生成式视频模型Stable Video Diffusion（SVD）。

Stability AI官方博客显示，全新SVD支持文本到视频、图像到视频生成：

‍ Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快 ‍

并且还支持物体从单一视角到多视角的转化，也就是3D合成：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

根据外部评估，官方宣称SVD甚至比runway和Pika的视频生成AI更受用户欢迎。

虽然目前只发布了基础模型，但官方透露“正计划继续扩展，建立类似于Stable Diffusion的生态系统”。

目前论文代码权重已上线。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

最近视频生成领域不断出现新玩法，这次轮到Stable Diffusion下场，以至于网友们的第一反应就是“快”，进步太快！

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

但仅从Demo效果来说，更多网友们表示并没有感到很惊喜。

虽然我喜欢SD，而且这些Demo也很棒……但也存在一些缺陷，光影不对、而且整体不连贯（视频帧与帧之间闪烁）。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

总归来说这是个开始，网友对SVD的3D合成功能还满是看好：

我敢打赌，很快就会有更好的东西出来，到时候只要描述一下，就会得到一个完整的3D场景。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

SD视频官方版来袭

除了上面展示的，官方还发布了更多Demo，先来看一波：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

太空漫步也安排上：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

背景不动，只让两只鸟动也可以：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

SVD的研究论文目前也已发布，据介绍SVD基于Stable Diffusion 2.1，用约6亿个样本的视频数据集预训练了基础模型。

可轻松适应各种下游任务，包括通过对多视图数据集进行微调从单个图像进行多视图合成。

微调后，官方公布的是两种图像到视频模型，可以以每秒3到30帧之间的自定义帧速率生成14（SVD）和25帧（SVD-XT）的视频：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

之后又微调了多视角视频生成模型，叫做SVD-MV：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

根据测试结果，在GSO数据集上，SVD-MV得分优于多视角生成模型Zero123、Zero123XL、SyncDreamer：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

值得一提的是，Stability AI表示SVD目前仅限于研究，不适用于实际或商业应用。SVD目前也不是所有人都可以使用，但已开放用户候补名单注册。

视频生成大爆发

最近视频生成领域呈现出一种“混战”的局面。

前有PikaLabs开发的文生视频AI：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

后又有号称“史上最强大的视频生成AIMoonvalley推出：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

最近Gen-2的“运动笔刷”功能也正式上线，指哪画哪：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

这不现在SVD又出现了，又有要卷3D视频生成的可能。

但文本到3D生成方面好像还没有太多进展，网友对这一现象也很是困惑。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

有人认为数据是阻碍发展的瓶颈：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

还有网友表示原因在于强化学习还不够强：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

家人们对这方面的最新进展有了解吗？欢迎评论区分享～

论文链接：https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf

参考链接：
[1]https://stability.ai/news/stable-video-diffusion-open-ai-video-model
[2]https://news.ycombinator.com/item?id=38368287

— 完 —

MEET 2024大会定档！

首批嘉宾阵容公布

量子位「MEET2024智能未来大会」正式定档12月14日！点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉、商汤科技王晓刚、DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

点击“预约”按钮，一键直达大会直播现场！

点这里👇关注我，记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

2023 年 11 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

西风发自凹非寺
量子位 | 公众号 QbitAI

SD视频官方版来袭

视频生成大爆发

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

给AI打个分，结果搞出17亿估值独角兽？？？

1956-2026：人类与机器智能的七十年对话

全自主、更好用！北京人形 “干活机器人” 惊艳亮相 CES2026

杜比在CES 2026重塑了观影、娱乐的方式

OceanBase蝉联中国分布式数据库本地部署市场第一，领跑国产数据库

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

给AI打个分，结果搞出17亿估值独角兽？？？

1956-2026：人类与机器智能的七十年对话

全自主、更好用！北京人形 “干活机器人” 惊艳亮相 CES2026

杜比在CES 2026重塑了观影、娱乐的方式

OceanBase蝉联中国分布式数据库本地部署市场第一，领跑国产数据库

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

西风 发自 凹非寺量子位 | 公众号 QbitAI

SD视频官方版来袭

视频生成大爆发

文心AIGC

西风发自凹非寺
量子位 | 公众号 QbitAI