AI视频进入“加速度”时代:30%加速+细节随手P,等等党和抽卡党在拍我AI上有救了!
梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
等等党和抽卡党们,这回做视频终于不用等!半!天!了!
相信大家都有这种感觉:每次用AI生成视频,刚按下按钮,屏幕就跳出来一句“前方排队xxx人”,等吧,好不容易排到了,结果还得再磨个两三分钟才能出片……
而且生成效果到底咋样,几乎纯看运气,不满意还得重新抽卡,这次终于不一样了,等等党有救,抽卡党翻身~
现在,从点击生成到看到成片,不到一分钟就能轻松产出一条5秒的高清视频大片,画质妥妥拉满,效果be like:

你以为这就结束了?大NO特NO!现在碰到不满意的视频也不用重新抽卡,直接在线精修,想怎么P就怎么P。
周末来得刚刚好,蒙娜丽莎牵着兵马俑走进了魔都街头,这回不当文艺女神,当起了“沪上阿姨”:

emm…人都到上海了,手里却还举着杯可乐,怎么看都不太对劲,于是我顺手一改,把可乐P成了奶茶,这样才对嘛,入乡随俗入乡随俗~

不卖关子,这就是「拍我AI」(即PixVerse)重磅上线的升级版:V5 Fast,视频生成速度提升超30%,此外还上线了「Modify」精修功能,支持端到端视频编辑,生成完还能接着改~
两项关键能力一起落地,让视频创作第一次有了“快+可控”的完整体验,目前新功能已在「拍我AI」重磅上线,废话不多说,跟我一起roll起来吧!
AI视频也实现P图自由了
过去这一年,AI视频从创作者工具变成了商业化生产力。
品牌在用它做campaign,自媒体在手搓各种AIGC新玩法,商家用它做新品素材,而更能感受到变化的,是大众化的使用场景——
旅行时随手做个vlog、给猫猫剪段日常、记录小朋友的成长瞬间……越来越多人不再只是看别人用AI做视频,而是开始用AI记录自己的生活、讲自己的故事、创作属于自己的灵感。
然而,现在市面上绝大多数的AI视频工具更像是一次生成定生死,一旦要改,流程立刻变得又慢又不确定:
一个细节的错位、一个画面的跳帧都可能让全片重来,角色不稳要返工,元素乱跳要重生,提示词不准又得重新roll,专业团队焦虑,普通用户更无从下手,明明是小改动,时间精力的投入成本却很大。
这直接带来的影响是:对内容团队是流程割裂,对商用制作是交付风险,对普通用户更是一道专业门槛的困扰。
因此,可修改性目前已经成为现在AI视频市场最真实、也最迫切的需求之一。
拍我AI的Modify精修能力,就是顺着这条需求线自然进化出来的,它所代表的是一类真正意义上的「市场创新」。
它把单帧修改变成了模型对全片的重新理解和一致化处理,实现跨帧推理、统一风格、主体稳态等一系列高要求的流程。
这类底层架构的精修方式目前在业内极为稀缺,基本属于拍我AI的独特能力。
也就是让创作者的工作流真正闭环,也让普通用户第一次拥有了拍了视频还能随手改的自由度。
AI视频从“能生成”走向“能被每个人掌控”这一步,终于变得可行了。
元素替换:实物级别的可控编辑
在这次全新推出的「Modify」精修功能中,我们不必再因为某个元素生成得不对、哪一帧出了小差错就从头反复生成,也不用担心提示词没写准、没编辑到位会导致整段视频推倒重来。
现在我们可以想改哪里就改哪里,真的做到了万物皆可替换。
先从我们创作中出现频率最高、需求最迫切的物品替换能力说起,我先让V5 Fast帮我生成了一段“男子在KTV放飞自我唱歌”的视频:

接着我在Modify里把男子换成了一只沉浸式飙歌的小猫:

AI不仅保留了原视频里人物的肢体姿势、口型节奏,连服装细节也一起copy过去了,最关键的是整个场景环境都没崩,替换得非常自然。
除了能替换物品、人物外,Modify还能替换背景,我把一个超飒女孩登山的视频丢给了AI:

嗯…感觉这身专业户外装备用来登一座普通小山多少有点“杀鸡用牛刀”!于是我让Modify把背景换成积雪覆盖的雪山,这下才对味儿嘛:

这个替换的难点在于原视频的背景是移动的,但AI不仅完成了背景替换,还自动补足了每一帧的场景一致性,甚至连女孩发丝透出的光线,都和雪山环境的冷色调对上了,可以说是非常周到了~
这种级别的元素替换能力,实质上把「改视频」这件事从高门槛的专业技能,重新交回给了所有用户。
无论是换物件、调环境,还是修一个不满意的细节,都终于能简单到人人敢下手、人人能做好。
局部修改:从风格到质感都能调
除了能修改那些“看得见摸得着”的视频元素外,一些更抽象、更细微的局部变化,比如光影、质感、整体氛围这种非实体的细节,Modify也完全hold得住。
这类需求在行业里一直是痛点:元素替换容易量化,但无形的局部往往最难改,一不小心就会破坏整段视频的连贯性。
咱们不走简单路线,直接上点难度,先来考验一下AI的风格修改能力。
现在打工人的怨气是真越来越重了,看下面这位小哥,工作崩溃到想直接怒砸键盘(但还是忍住了):

我们就用Modify给他换个画风,试试把这场“社畜崩溃现场”重绘成「美式漫画」风格:

不光是整体风格切得干净,连衣服的褶皱、肢体动作、情绪张力都被1:1保留下来,风格想怎么改就怎么改,还能保持动作一致性,这才叫真正的“可控风格替换”~
不仅如此,Modify还能对物品的「材质」进行精确修改,我先是用V5 Fast生成了一段黑色亮面跑车驰骋在公路上的视频:

随后让Modify把车身材质替换成红色哑光,在镜头运动不变、光影一致的前提下,AI依然稳稳完成了替换:

亮面换哑光、金属换塑料、皮革换织物,看似只是质感变化,但牵涉光影反射、表面细节、镜头轨迹,一旦处理不到位就会立刻穿帮。
而Modify既做到了替换材质,又保证每帧视觉逻辑都成立。
除了能修改风格和材质,Modify还能同步修改「光线」、「色调」等非实体细节,那些在传统视频制作里最费力、最考验眼力的部分,也终于能交给AI来稳稳搞定。
人物编辑:跟修图烦恼说bye bye
经常拍照的人应该都有这种痛苦体验——给视频「人物修图」真的太、太、太麻烦了!
毕竟图片想怎么修就怎么修,可视频一旦要改就麻烦得多,过去那些在修图软件里拖一拖、点两下就能解决的小调整,放到视频里往往得重做整条。
这次Modify也把这个现实痛点考虑进去了:
视频人物不仅能用一句提示词直接改,还能自由调整年龄、服装、气质,甚至做到“整个状态”一起同步变化。
这是我喂给Modify的一张游客照,一个和长颈鹿合影的小男孩,因为拍摄角度的原因,男孩的眼睛显得有点小,皮肤也有些小瑕疵:

于是乎,我给AI下的指令是,让男孩眼睛更大一点、皮肤更平滑一点,Modify立刻就给出了效果:

眼睛肉眼可见地放大,皮肤也有了明显的磨皮效果,不得不说,这波P图功底确实有点东西~
再来玩点有意思的,来试试AI邪修术之——年龄修改!我先喂给AI一段老奶奶的视频:

然后只对Modify说了三个字——变!年!轻!结果老奶奶直接年轻了三十岁:
人物能被自由修改,并不只是创意玩法。
在这个过程中,行业得到了更可控的创作能力,但对普通人而言,更大的价值在于:影像不再只能记录当下,它还能记录“可能的样子”。
爷爷奶奶可以看看年轻时的模样,普通人也可以看到自己理想中的自己,AI视频让影像变得更温柔、更有想象力。
此外,Modify还具备「尺寸修改」能力,哪怕第一次生成的比例不太对,也能用一句提示词随心调整,彻底摆脱“尺寸错了只能重生”的麻烦事儿。
随着Modify把「可编辑性」补齐,AI视频终于从一次性生成的模型能力,走向可反复打磨的创作工具。
这不仅让专业内容生产更可控,也让普通人拥有了真正掌控动态影像的权利,未来的视频创作,不再由模型决定,而是由使用它的每一个人决定。
生成提速30%,大片稳出不误事
生成速度一直是AI视频创作里绕不过去的问题。
无论是内容团队、短视频创作者,还是需要频繁验证想法的品牌方,都面临同一个困扰:
目前绝大多数AI视频的生成速度,赶不上用户内容交付的节奏,也赶不上用户灵感增长的速度。
团队需要高频实时产出,短视频创作者需要快速AB测试,品牌方则需要在短周期内验证创意想法,只要生成一慢,所有链路就一起被卡住。
这次爱诗科技上线的拍我AI(PixVerse)V5 Fast,就是在这个现实痛点上做了明显优化。
相比上一代V5模型,V5 Fast生成速度提升了30%+,举个直观的例子就是,原本5秒的高清视频要等1~2分钟,现在只需要在1分钟以内就能看到成片。
原因很简单,以前的Sora、视频版Stable Diffusion都是直接用一个超级大的模型一次性预测几十上百帧,模型看得太多太远,算得特别慢。
而V5 Fast让模型推理结构变得轻量化、帧间计算依赖被缩短,高分辨率的视频生成不再是“倍速变慢”的瓶颈环节。
看似还是那条推理链,但加速点遍布每一个视频节点,速度自然就提升得非常明显。
最关键的是,速度提上来了,效果也没掉链子,动作细节和风格依旧在线,对内容创作者来说,这种“赶得上点”的生成速度,才是真正能用起来的节奏。
为了更直观地对比,我们测试了拍我AI(PixVerse)V5 Fast与市面主流产品在相同提示词&参数条件下的表现,没见过比这更快的。
拍我AI(PixVerse) V5 Fast约40秒即可生成完成1080P的5秒视频,等待过程更短、生成体验更连贯。符合社交平台传播的360P和720P生成速度更快,数秒也就完成了。
从Modify精修功能到V5 Fast提速模型,背后是「爱诗科技」在AI视频生成领域持续的技术投入与产品打磨。
今年10月,爱诗科技完成了1亿元人民币的B+轮融资,仅用两年时间就完成了五次模型迭代、八个版本更新,率先在行业内实现了DiT架构、准实时生成、角色驱动视频等关键突破。
更值得注意的,爱诗还是最早在V3.5破10秒大关的(去年12月)。进入2025年1月,V4进入5秒准实时生成时代的平台,在全球已具规模的视频生成平台中生成速度最快。
作为其旗下核心产品,海外版PixVerse与国内版「拍我AI」累计服务超过一亿用户,月活突破1600万,自去年启动商业化以来,收入增长超10倍,成为全球增长最快的AI视频平台之一。
这次发布的V5 Fast模式与Modify精修功能,进一步降低了AI视频的创作门槛,提升了创作自由度,视频生成不再因「慢」和「一次定生死」而被卡住。
生成能跟上节奏,修改能随手完成,AI视频创作的工作流才真正完整起来。灵感不再被速度拖住,视频也不再是一锤子买卖,而是成为人人都能打磨、能调整、能反复利用的创意载体。
更重要的是,那些平时不太被注意、却跟日常生活贴得很紧的小需求,也能被看到、被重视、被满足,AI也不再高高在上,而是开始贴着我们的日常需求去跑,贴着每一个细微的小动作去做。
这次「拍我AI」新功能上线的意义,也正是在这里:
每一个人都可以无差别享受先进AI技术的乐趣。