阿里巴巴开源旗下文生视频模型万相2.1
阿里云旗下视觉生成基座模型万相2.1(Wan)重磅开源,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。据悉,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出。在评测集VBench中,万相2.1以总分86.22%的成绩大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。万相2.1还是首个具备支持中文文字生成能力,且同时支持中英文文字特效生成的视频生成模型。