北大联合DeepSeek开源DSpark加速框架，大幅破解大模型高并发速度瓶颈

北大联合DeepSeek开源DSpark加速框架，大幅破解大模型高并发速度瓶颈。

6月27日，人工智能企业DeepSeek与北京大学联合推出全新技术成果，正式开源DSpark大模型推理加速框架。该框架专门解决当下大语言模型普遍存在的痛点：高并发场景下响应慢、生成效率低、算力浪费严重，能在不降低回答质量的前提下，显著提升AI模型的运行速度与服务能力。

很多普通用户和开发者都有直观感受，AI模型智能程度越来越高，但多人同时在线使用时，经常出现回复卡顿、生成延迟、加载变慢的问题。传统大模型大多采用逐字生成的计算方式，算力消耗大、效率有限。而DSpark框架优化了底层计算逻辑，通过创新的生成与校验机制，告别单一死板的逐字运算模式，让模型推理过程更高效、更贴合真实商用场景。

目前，这套全新加速框架已经正式落地部署，搭载在DeepSeek主流的DeepSeek-V4-Flash、DeepSeek-V4-Pro两大模型预览版服务引擎中。对比此前线上通用的MTP-1单token推测解码方案，在系统整体吞吐量保持不变的前提下，单用户内容生成速度可稳定提升60%至85%，部分场景整体系统吞吐最高可提升数倍，提速效果十分显著。

对于开发者和行业用户来说，本次开源具备很高的实用价值。项目完整的研究论文、训练代码、模型检查点已全部在GitHub DeepSpec项目公开，完全免费开源、可直接部署使用。同时DSpark兼容性出色，不仅适配DeepSeek全系模型，还能兼容通义千问、Gemma等多款主流开源大模型，适用范围广。

更重要的是，该框架无需额外新增硬件设备，仅通过算法和架构优化就能大幅提升算力利用率、降低云端部署与运维成本，非常适合企业云端服务、高并发AI接口调用、大规模商用推理等场景。

北大与DeepSeek的联合技术开源，既有效解决了大模型商用落地的核心效率瓶颈，降低了行业AI落地门槛，也标志着国产大模型在底层推理优化、工程化落地层面，实现了新的技术突破，为国内AI产业高效、低成本规模化发展提供了坚实的技术支撑。

DC娱乐网

北大联合DeepSeek开源DSpark加速框架，大幅破解大模型高并发速度瓶颈

热门分类

北大联合DeepSeek开源DSpark加速框架， 大幅破解大模型高并发速度瓶颈

热门分类

北大联合DeepSeek开源DSpark加速框架，大幅破解大模型高并发速度瓶颈