2月12日,字节跳动官微发文表示,豆包视频生成模型Seedance2.0正式发布,现已全面接入豆包和即梦产品,并上线火山方舟体验中心,欢迎广大用户试用体验。

Seedance2.0较好地解决了物理规律遵循及长效一致性等难题,同时也赋予创作者前所未有的自由度,让视频生成质量和可控性达到专业生产场景要求。

目前,Seedance2.0限制了真人图像/视频作为主体参考。如需使用真人作为主体参考,须经本人验证或取得授权。

 

导演级操控,让视频生成“所想即所见”

稳定呈现复杂交互和运动:Seedance2.0在运动场景下的生成可用率达到业界SOTA水平,其在人物动作建模方面,有着自然连贯、遵循现实世界运动规律的显著优势。它能高保真地合成时序精密的复杂交互场景,也能在特写镜头中展现出高度逼真的细节与严密的物理逻辑,宛如实拍。

I2V prompt:画中人物心虚,眼睛左右看了看探出画框,快速地将手伸出画框拿起可乐喝了一口,并露出一脸满足的表情。这时传来脚步声,画中的人物赶紧将可乐放回原位,此时一位西部牛仔拿起杯子里的可乐走了。结尾镜头推进至纯黑背景下的顶光可乐特写,画面最下方出现艺术感字幕和旁白:“宜口可乐,不可不尝!”。

 

Seedance2.0评测:综合表现行业领先

为全面评估模型在多模态场景的综合能力,字节跳动Seed团队协同影视领域的专家,建立了覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。

 

文生视频能力评测

 

图生视频能力评测

 

多模态参考生成评测

在各项评测中,Seedance2.0的综合表现达到行业领先水平。但与此同时,模型在细节稳定性、多人口型匹配、多主体一致性、文字还原精度和复杂编辑效果等方面仍有优化空间。

Seedance2.0还远不完美,其生成结果仍存在诸多瑕疵。我们将持续探索大模型与人类反馈的深度对齐,让更高效、更稳定、更具想象力的音视频生产工具,服务更多创作者。

更多热点速报、权威资讯、深度分析尽在北京日报App

来源:字节跳动

如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353