等待了几个月的DeepSeek V4它来了,刚刚已正式上线并同步开源,性能比肩顶级闭源模型!
两个版本:V4-Pro和 V4-Flash
100万token上下文,全新注意力机制:token维度压缩+DSA稀疏注意力,比传统方法大幅降低了对计算和显存需求,现在百万上下文是DeepSeek官方标配
V4-Pro的Agent能力相比前代显著增强,在Agentic Coding中达到当前开源模型最佳水平
据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,与Opus 4.6思考模式还是存在一定差距
世界顶级推理性能上,在数学、STEM、竞赛型代码的测评中,V4-Pro超当前所有已公开评测的开源模型,成绩比肩世界顶级闭源模型
在世界知识测评中大幅领先其他开源模型,稍逊于Gemini-Pro-3.1
V4-Flash在世界知识储备上较Pro稍逊,但推理能力接近,DeepSeek-V4-Flash在简单Agent任务上与Pro相当,不过高难度复杂任务有差距
目前API 已上线V4-Pro与V4-Flash,支持OpenAI ChatCompletions接口与Anthropic接口,访问新模型时,base_url不变, model参数需要改为deepseek-v4-pro或 deepseek-v4-flash
V4-Pro和Flash均同时支持非思考模式与思考模式
HuggingFace:网页链接ModelScope:网页链接技术报告:网页链接
DeepSeek V4deepseekdeepseek最新大模型

