DeepSeek DSpark,把大模型从“蹦字”变“喷字”🔥吞吐量暴涨51%-400%,推理提速60%-85%!
通俗拆解就三招:1️⃣ 草稿制:小头先猜一串,大头批量批改,一次搬运算10个词,绝不浪费显存带宽。2️⃣ 杂交引擎:先并行瞎蒙,再只看前1个词(马尔科夫头)串行修正,又快又准。3️⃣ 动态调度:闲时多猜,忙时少猜,边跑边校准,越跑越精。
这不是单一算法,是算法+调度+硬件三位一体的端到端工程闭环。
结论:大利好存储/算力基建。效率翻倍,同样算力赚更多钱;推理变便宜,AI用量只会暴增(现在深度用户