DC娱乐网

北大联合DeepSeek开源DSpark加速框架, 大幅破解大模型高并发速度瓶颈

北大联合DeepSeek开源DSpark加速框架, 大幅破解大模型高并发速度瓶颈。

6月27日,人工智能企业DeepSeek与北京大学联合推出全新技术成果,正式开源DSpark大模型推理加速框架。该框架专门解决当下大语言模型普遍存在的痛点:高并发场景下响应慢、生成效率低、算力浪费严重,能在不降低回答质量的前提下,显著提升AI模型的运行速度与服务能力。

很多普通用户和开发者都有直观感受,AI模型智能程度越来越高,但多人同时在线使用时,经常出现回复卡顿、生成延迟、加载变慢的问题。传统大模型大多采用逐字生成的计算方式,算力消耗大、效率有限。而DSpark框架优化了底层计算逻辑,通过创新的生成与校验机制,告别单一死板的逐字运算模式,让模型推理过程更高效、更贴合真实商用场景。

目前,这套全新加速框架已经正式落地部署,搭载在DeepSeek主流的DeepSeek-V4-Flash、DeepSeek-V4-Pro两大模型预览版服务引擎中。对比此前线上通用的MTP-1单token推测解码方案,在系统整体吞吐量保持不变的前提下,单用户内容生成速度可稳定提升60%至85%,部分场景整体系统吞吐最高可提升数倍,提速效果十分显著。

对于开发者和行业用户来说,本次开源具备很高的实用价值。项目完整的研究论文、训练代码、模型检查点已全部在GitHub DeepSpec项目公开,完全免费开源、可直接部署使用。同时DSpark兼容性出色,不仅适配DeepSeek全系模型,还能兼容通义千问、Gemma等多款主流开源大模型,适用范围广。

更重要的是,该框架无需额外新增硬件设备,仅通过算法和架构优化就能大幅提升算力利用率、降低云端部署与运维成本,非常适合企业云端服务、高并发AI接口调用、大规模商用推理等场景。

北大与DeepSeek的联合技术开源,既有效解决了大模型商用落地的核心效率瓶颈,降低了行业AI落地门槛,也标志着国产大模型在底层推理优化、工程化落地层面,实现了新的技术突破,为国内AI产业高效、低成本规模化发展提供了坚实的技术支撑。