DC娱乐网

DeepSeek V4宣布,在输入输出2.5折的基础上,命中缓存再折上折,再打一

DeepSeek V4宣布,在输入输出2.5折的基础上,命中缓存再折上折,再打一折。

那你知道什么叫命中缓存吗?命中缓存的有效时间是多少?

所谓的命中缓存就是:同样的问题,你之前问过,大模型已经算过一次了,答案存在服务器的缓存里。第二次再问一模一样的,就不用重新算了,直接从缓存里取结果,所以便宜很多。

举个例子 + 算你的账:
假设你问"DeepSeek V4有啥优点",第一次问的时候:
- 输入100token,输出300token
- 原价输入0.01元/千token,输出0.03元/千token
- 打2.5折后:(0.01×0.1 + 0.03×0.3)×0.25 = 0.0025元

如果你5分钟内再问一次完全一样的问题:
- 输入这100token就"命中缓存"了,不用重新算
- 输入部分:2.5折基础上再打1折 = 0.25折*0.1
- 输入费用:0.01×0.1×0.25×0.1 = 0.000025元
- 输出还是按2.5折算
- 总费用比第一次再省约90%的输入成本

补充说明:
- 一般只有完全相同的输入才会命中(差一个字都可能不行)
- 缓存有有效期(通常几分钟到几小时)
- 主要好处是:重复提问、调试prompt的时候特别省钱