DC娱乐网

DeepSeek全系大降价,最低每百万Token只要两分钱! 4月26日,De

DeepSeek全系大降价,最低每百万Token只要两分钱!

4月26日,DeepSeek官方发布API价格调整公告。其中,DeepSeek‑V4‑Flash输入缓存命中价格从0.2元/百万Token降至0.02元/百万Token。面向企业用户的V4‑Pro更猛,原价1元的缓存输入降至0.1元,叠加限时2.5折后,2026年5月5日之前实际仅0.025元/百万Token。缓存未命中输入从12元降至3元,输出从24元降至6元。高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用,商用成本直接断崖式下跌。

降价的底气来自于V4的技术升级。V4自研稀疏注意力架构大幅降低了推理算力消耗,Pro版单Token算力仅为V3.2的27%,KV缓存降至10%。昇腾超节点全系列产品的批量适配则进一步降低硬件成本。DeepSeek同时释放出清晰的国产化信号:技术报告中明确将英伟达GPU和华为昇腾NPU并列验证,下半年昇腾950超节点批量上市后,Pro版价格有望进一步下调。

可见,这次降价不是拿入门版做个姿态,而是全系列普降,覆盖了Pro和Flash所有缓存命中场景。尤其V4‑Pro限时2.5折后的2.5分钱价位,在同类顶级模型中几乎没有对手。过去半年,光模块、服务器、液冷这些算力上游环节频繁涨价,市场上关于算力供需失衡的担忧从未停止。而DeepSeek选择在这个节点反向操作,把大模型调用成本打到了“白菜价”。

一个容易被忽视的细节是,这次降价的核心受益场景是缓存命中率高的事务型应用。换句话说,不是鼓励你用大模型随便聊天,而是让那些需要反复调用相同知识库的Agent工作流、需要反复推理相似任务的工业级应用,可以直接把成本压下来。当调用成本低到可以忽略不计,技术部门就不用再纠结“用不用AI”而是直接讨论“怎么用得好”。

总之,这轮降价将显著降低AI Agent、企业级知识库、智能客服等B端应用的准入门槛,从而推动企业对AI的采用从试点走向全面部署。这不是简单的价格战,是一次从技术层面重构商业模式的战略行动。DeepSeek大模型的性价比正在成为新的护城河,而这一点是美国大模型无论如何也做不到的。