DC娱乐网

DeepSeek首轮融资后大动作:发布DSpark推理加速框架 生成速度提升60

DeepSeek首轮融资后大动作:发布DSpark推理加速框架 生成速度提升60%-85%继完成500亿元融资后,今日,DeepSeek首次放出开源新成果!DeepSeek开源了一套让现有模型跑得更快的工程方案:推出DeepSeek-V4-Pro-DSpark、DeepSeek-V4-Flash-DSpark模型,并开源推测解码框架DSpark以及推测解码训练框架DeepSpec。

根据同步上传的梁文锋署名、联合北京大学完成的论文《DSpark:基于半自回归生成的置信度调度推测解码》,将DSpark部署在DeepSeek-V4线上服务系统、承接真实用户流量时,它有效减少了无效校验带来的算力浪费。相较于成熟的生产基线方案(MTP-1),在保持整体吞吐不变的前提下,DSpark把单用户生成速度提升60%-85%。更关键的是,在严格交互时延约束下,DSpark避免了吞吐率大幅滑坡,实现了以往无法达成的性能档位,推高了整套服务系统的帕累托最优边界。

根据Hugging Face上的模型卡,DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型,而是在原有版本的基础上,增加了一个推测解码模块,用以加快推理速度、降低成本。DeepSeek提出DSpark推测解码框架,把高吞吐并行生成与自适应、感知负载的校验机制结合在一起。为保证草稿质量,DSpark采用半自回归架构:将并行主干网络与轻量串行模块相结合,建模块内token依赖,缓解末尾内容通过率衰减问题。