字节跳动旗下AI视频生成工具Seedance2.0近日开启小范围内部测试,其多模态交互能力与电影级画面生成效果引发科技圈热议。这款基于深度学习的新模型支持文本、图片双模态输入,用户可通过自然语言描述或参考图像生成5至10秒的高清视频片段。
在社交平台流传的测试案例中,Seedance2.0精准复现了1670年阿姆斯特丹的城市景观,其历史场景还原度显著优于同期谷歌发布的Genie3世界模型。有科技博主通过对比测试指出,该模型在建筑细节、光影效果和动态呈现方面展现出突破性进展,甚至能模拟不同季节的天气变化。
特斯拉创始人马斯克在社交媒体转发了相关演示视频,并评论称:"AI视频生成技术的迭代速度超出预期"。据内部人士透露,Seedance2.0采用全新的时空注意力机制,在保持画面连贯性的同时,将单次生成耗时压缩至行业平均水平的三分之一。
目前该模型已全面接入字节跳动旗下豆包平台,用户可在APP、网页端及PC客户端体验。操作界面新增"Seedance 2.0"专属入口,输入提示词后系统会自动推荐最佳画面参数。平台还推出"数字分身"功能,通过3D扫描技术创建用户虚拟形象,支持个性化视频内容创作。
技术文档显示,Seedance2.0支持4K分辨率输出,帧率最高可达60fps。在文本理解方面,模型能准确解析复杂指令,例如"生成中世纪城堡被龙卷风摧毁的慢镜头,画面偏冷色调"。开发团队表示,后续版本将增加更长视频生成和音频合成功能,进一步拓展创作边界。


