字节甩出“王炸”,Seedance 2.0 能否重新定义AI视频比赛?

作者:贾玥      时间: 2026-02-10      浏览数:8118

11.png

分析师/贾玥
校对/Tina
策划/Eason


深夜,一份标题仅有几个字的飞书文档悄然上线,却同时吸引了数百人在线围观。文档右上角的实时人数在十几个小时内从未跌落300人以下,即便在凌晨时分仍有近百人驻留。

这份文档宣布的,是字节跳动视频生成大模型Seedance 2.0 正式上线。文档副标题更为直白:Kill the game

几乎同一时间,科技博主“影视飓风”Tim发布的实测视频引爆全网:仅凭几张静态照片,模型便生成出与他本人高度相似的动态形象与声音。

知名游戏制作人冯骥在社交平台评价:“当前地表最强视频生成模型,没有之一。”

2.png


01
现象级出圈:一场没有发布会的热潮


29日,微博话题#Seedance2.0#迅速冲上热搜。资本市场同样迅速反应,A股传媒板块当日异动,中文在线、掌阅科技等多只股票涨停。

Seedance 2.0的传播路径呈现出典型的技术驱动型爆款特征:没有盛大的发布会,没有媒体预热,仅凭一份产品文档和首批用户的实测体验,就在专业圈层和大众市场同时引爆。

影视飓风”Tim的测试视频成为关键传播节点。视频中,除了“蜜雪冰城大战外企咖啡店”等创意视频外,Tim仅上传自己的静态照片,模型便生成了不仅外貌高度相似、连语音语调和个人标志性语速都完美复刻的动态视频。


3.gif


更令人惊讶的是,当上传仅显示楼栋正面的照片时,模型生成的运镜竟能自动转到建筑背面,仿佛知晓未在画面中呈现的场景细节。

这种超越简单图像补全、展现出场景理解能力的表现,让许多业内人士感到震惊。AI视频创作者海辛在社交媒体直言:“Seedance 2.0 是我26年来最大的震撼


02
从“抽卡游戏”到“导演工具箱”


Seedance 2.0 的核心突破,在于它将AI视频生成从概率性的抽卡游戏,变成了确定性的生产工具

传统AI视频生成面临的最大痛点之一是废片率过高,行业平均可用率仅约20%。而根据内测反馈,Seedance 2.0 的可用率直接跃升至90%以上这意味着生成成本的大幅降低和效率的指数级提升。

模型的技术架构采用双分支扩散变换器,可同时处理视频和音频生成,实现音画同步的原生音频输出。这解决了长期困扰行业的音画不同步问题,角色口型与台词能够精准匹配。

提示词:生成一个15秒的MV视频。关键词:稳重构图 / 轻推拉低角度英雄感 / 纪实但高级A超广角建立镜头,低机位轻微仰拍,悬崖土路与复古旅行车占画面下三分之一,远处海面与地平线拉开空间,夕阳侧逆光体积光穿过尘粒,电影级构图,真实胶片颗粒,微风吹动衣角。

提示词:@图片1的猴子走向奶茶店柜台,镜头跟随在他身后,一位@图片2的比熊服务员正在吧台处擦拭制作工具,猴子向服务员用四川口音点单:“幺妹儿,霸王别姬有得没得?”

切镜,特写。

服务员放下手里的活,怪异地看了老头一眼后回答:“没得,美式要不要得嘛”

切镜,镜头给到猴子。

他挠了挠头念念有词:“没事……?我有事!孙儿叫我来买个奶茶,就叫个撒子霸王别姬嘛”

其最受关注的自分镜能力,允许用户只需描述人物和情节,模型便会自动规划镜头语言。如输入参考@1@2角色,@3@4角色,模仿@视频1的动作,在@5的枫叶林中打斗,系统便能生成包含多角度切换、运镜流畅的完整叙事片段。

这已经不是在生成视频,而是在拍片子一位影视行业从业者评价道。

模型还支持全方位多模态参考,用户可同时上传最多9张图片、3段视频和3段音频作为参考素材,从动作、特效、运镜风格到人物外貌、场景氛围均可精准控制。

提示词:@图片1作为画面的首帧图,镜头旋转推近,人物突然抬头,人物面部长相参考@图片2,开始大声咆哮,激动带有一些喜剧色彩。然后人物身体变身成为一只熊


03

行业冲击:重构与争议并存


Seedance 2.0 的出现,直接冲击了多个相关行业。视频/漫剧Agent赛道首当其冲,当模型自身能力已能覆盖复杂工作流时,单纯做流程拆解的中间层价值被大幅削弱。

对传统影视制作,尤其是短剧、特效领域,影响更为深远。一位院线电影从业者算了一笔账:传统流程下,一个5秒特效镜头可能需要高级制作人员近一个月时间,成本超过30000元;而使用Seedance 2.0同样效果的生成时间约2分钟,成本不足3

效率提升上万倍,成本下降上万倍——这种量级的变化足以重构产业逻辑。

然而技术狂奔也伴随着争议。Tim在测试中发现,模型能完美复刻他的形象与声音,推测其训练数据包含了影视飓风团队过往发布的大量视频素材。引发了对AI训练数据来源与授权问题的广泛讨论

北京航空航天大学人工智能研究院教授沙磊指出,目前国内外AI大模型普遍使用公开数据进行训练,这是行业通行做法。但声音和视频比文字具有更强的个人特定性,使得数据使用的责任边界问题更加凸显。

字节跳动已迅速采取风险防控措施,包括限制真人视频生成功能,要求活体认证,并禁止输入真人图片/视频作为主体参考。这种带着镣铐的狂奔,折射出技术发展速度与规则完善进度之间的张力。

Seedance 2.0标志着AI视频生成领域的一个重要转折点。

当技术门槛被大幅降低,创作者不再需要掌握复杂的剪辑软件或昂贵的拍摄设备,也能实现高质量的视频创作。

在即梦平台的社区里,一位刚用Seedance 2.0完成其首部AI动画短剧的创作者写道:“当我看着那些流畅的镜头语言、一致的角色面孔,配上自动生成的音效时,我知道某种创作门槛已经永远消失了。”

比赛的终结,不过是另一种开始。

北京第一新声信息咨询有限公司 版权所有(C)2024 京ICP备2024089855号-1

第一新声商务经理 Sherry
Tel:18910717116

第一新声商务经理 Sherry
Tel:18910717116

第一新声研究客服 Kim小严

第一新声编辑客服 Tina

第一新声运营经理 孟小新