DC娱乐网

传DeepSeek将于下周发布最新大模型V4

据知情人士透露,该版本为原生多模态架构,可同步生成图片、视频与文本,并针对国产算力完成深度优化,意在降低对海外芯片依赖、加速推理环节本土化。

报道称,该公司同步准备一份简短技术说明,完整报告预计一个月后发布。

根据公开资料整理,正在秘密测试的V4Lite代号“sealion-lite”,上下文窗口达100万tokens,较V3系列128K提升近8倍;参数规模约2000亿,完整版或突破1万亿。

资料显示,DeepSeek上次重大更新为2025年1月20日的R1推理模型,此次V4发布时间间隔超一年。