DC娱乐网

以前大家普遍有一个共识:大模型想要跑得更快、更便宜,最直接的方法就是堆更多GPU

以前大家普遍有一个共识:大模型想要跑得更快、更便宜,最直接的方法就是堆更多GPU、投入更多算力。但DeepSeek联合北京大学开源的DSpark,换了一个思路:不增加硬件,而是通过推理框架优化,把现有GPU的效率发挥到更高。官方数据显示,单用户生成速度最高提升85%,整体推理吞吐量最高提升4倍,而且不影响模型效果。

这也说明,大模型竞争正在进入下半场。比的不只是模型能力,还有工程优化能力。谁能用同样的算力跑出更高效率、更低成本,谁就更有竞争力。

DeepSeek新发布的DSpark有多强