中国科技发展,每隔一段时间都一个惊喜。这几天,字节跳动公司刚刚发布了世界上最先进的视频生成模型Seedance 2.0 轰动了全球。 它是原生音频生成器,具有唇形同步语音 + 音乐的功能,质量比 Veo 3.1 / Sora 2 有了显著提升,支持多模态输入,2K分辨率。 它不仅限于电影级视频,还能进行产品演示,视频质量很难看出它是人工智能制作的。 口型同步效果很出色,但真正的亮点在于“参考功能”。能够上传视频来控制动作,并上传图片来锁定风格,最终解决了一致性问题。它使模型不再像老虎机一样,而是真正成为了一个指导工具。 字节跳动趁着 Sora 还没正式上线,就把这个功能推送出来,这简直是赤裸裸的炫耀。 字节跳动 字节AI团队

