DeepSeek全系大降价，最低每百万Token只要两分钱！ 4月26日，De

DeepSeek全系大降价，最低每百万Token只要两分钱！

4月26日，DeepSeek官方发布API价格调整公告。其中，DeepSeek‑V4‑Flash输入缓存命中价格从0.2元/百万Token降至0.02元/百万Token。面向企业用户的V4‑Pro更猛，原价1元的缓存输入降至0.1元，叠加限时2.5折后，2026年5月5日之前实际仅0.025元/百万Token。缓存未命中输入从12元降至3元，输出从24元降至6元。高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用，商用成本直接断崖式下跌。

降价的底气来自于V4的技术升级。V4自研稀疏注意力架构大幅降低了推理算力消耗，Pro版单Token算力仅为V3.2的27%，KV缓存降至10%。昇腾超节点全系列产品的批量适配则进一步降低硬件成本。DeepSeek同时释放出清晰的国产化信号：技术报告中明确将英伟达GPU和华为昇腾NPU并列验证，下半年昇腾950超节点批量上市后，Pro版价格有望进一步下调。

可见，这次降价不是拿入门版做个姿态，而是全系列普降，覆盖了Pro和Flash所有缓存命中场景。尤其V4‑Pro限时2.5折后的2.5分钱价位，在同类顶级模型中几乎没有对手。过去半年，光模块、服务器、液冷这些算力上游环节频繁涨价，市场上关于算力供需失衡的担忧从未停止。而DeepSeek选择在这个节点反向操作，把大模型调用成本打到了“白菜价”。

一个容易被忽视的细节是，这次降价的核心受益场景是缓存命中率高的事务型应用。换句话说，不是鼓励你用大模型随便聊天，而是让那些需要反复调用相同知识库的Agent工作流、需要反复推理相似任务的工业级应用，可以直接把成本压下来。当调用成本低到可以忽略不计，技术部门就不用再纠结“用不用AI”而是直接讨论“怎么用得好”。

总之，这轮降价将显著降低AI Agent、企业级知识库、智能客服等B端应用的准入门槛，从而推动企业对AI的采用从试点走向全面部署。这不是简单的价格战，是一次从技术层面重构商业模式的战略行动。DeepSeek大模型的性价比正在成为新的护城河，而这一点是美国大模型无论如何也做不到的。

DC娱乐网

DeepSeek全系大降价，最低每百万Token只要两分钱！ 4月26日，De

热门分类