以前大家普遍有一个共识：大模型想要跑得更快、更便宜，最直接的方法就是堆更多GPU

以前大家普遍有一个共识：大模型想要跑得更快、更便宜，最直接的方法就是堆更多GPU、投入更多算力。但DeepSeek联合北京大学开源的DSpark，换了一个思路：不增加硬件，而是通过推理框架优化，把现有GPU的效率发挥到更高。官方数据显示，单用户生成速度最高提升85%，整体推理吞吐量最高提升4倍，而且不影响模型效果。

这也说明，大模型竞争正在进入下半场。比的不只是模型能力，还有工程优化能力。谁能用同样的算力跑出更高效率、更低成本，谁就更有竞争力。

DeepSeek新发布的DSpark有多强