中国AI公司DeepSeek计划于本周推出新一代大语言模型V4，这是该公司自20

中国AI公司DeepSeek计划于本周推出新一代大语言模型V4，这是该公司自2025年初推出推理模型R1以来的首次重大更新。新模型将具备多模态能力，可同时处理文本、图像与视频生成。DeepSeek此次与华为、寒武纪合作，让模型能够在国产AI芯片上运行，中国正加速降低对英伟达等美国芯片的依赖。此次发布选在中国全国两会前夕，也可能进一步巩固DeepSeek作为国家级AI代表企业的地位。 DeepSeek此前曾宣称，能用远低于硅谷竞争对手的算力打造性能接近的模型，一度被视为中国AI崛起的重要象征。不过目前高阶模型训练仍高度依赖英伟达芯片，DeepSeek尝试使用华为硬件进行训练时曾遭遇技术难题。新模型预计主要针对推理运算优化，以带动本土芯片需求。与此同时，美国AI公司Anthropic指控DeepSeek等中国实验室利用模型蒸馏技术，通过学习先进模型的输出来缩小与美国AI技术的差距。

DC娱乐网

中国AI公司DeepSeek计划于本周推出新一代大语言模型V4，这是该公司自20

热门分类