中国AI公司DeepSeek计划于本周推出新一代大语言模型V4,这是该公司自2025年初推出推理模型R1以来的首次重大更新。 新模型将具备多模态能力,可同时处理文本、图像与视频生成。DeepSeek此次与华为、寒武纪合作,让模型能够在国产AI芯片上运行,中国正加速降低对英伟达等美国芯片的依赖。 此次发布选在中国全国两会前夕,也可能进一步巩固DeepSeek作为国家级AI代表企业的地位。 DeepSeek此前曾宣称,能用远低于硅谷竞争对手的算力打造性能接近的模型,一度被视为中国AI崛起的重要象征。不过目前高阶模型训练仍高度依赖英伟达芯片,DeepSeek尝试使用华为硬件进行训练时曾遭遇技术难题。 新模型预计主要针对推理运算优化,以带动本土芯片需求。与此同时,美国AI公司Anthropic指控DeepSeek等中国实验室利用模型蒸馏技术,通过学习先进模型的输出来缩小与美国AI技术的差距。
