DeepSeek首轮融资后大动作：发布DSpark推理加速框架生成速度提升60

DeepSeek首轮融资后大动作：发布DSpark推理加速框架生成速度提升60%-85%继完成500亿元融资后，今日，DeepSeek首次放出开源新成果！DeepSeek开源了一套让现有模型跑得更快的工程方案：推出DeepSeek-V4-Pro-DSpark、DeepSeek-V4-Flash-DSpark模型，并开源推测解码框架DSpark以及推测解码训练框架DeepSpec。

根据同步上传的梁文锋署名、联合北京大学完成的论文《DSpark：基于半自回归生成的置信度调度推测解码》，将DSpark部署在DeepSeek-V4线上服务系统、承接真实用户流量时，它有效减少了无效校验带来的算力浪费。相较于成熟的生产基线方案（MTP-1），在保持整体吞吐不变的前提下，DSpark把单用户生成速度提升60%-85%。更关键的是，在严格交互时延约束下，DSpark避免了吞吐率大幅滑坡，实现了以往无法达成的性能档位，推高了整套服务系统的帕累托最优边界。

根据Hugging Face上的模型卡，DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型，而是在原有版本的基础上，增加了一个推测解码模块，用以加快推理速度、降低成本。DeepSeek提出DSpark推测解码框架，把高吞吐并行生成与自适应、感知负载的校验机制结合在一起。为保证草稿质量，DSpark采用半自回归架构：将并行主干网络与轻量串行模块相结合，建模块内token依赖，缓解末尾内容通过率衰减问题。

DC娱乐网

DeepSeek首轮融资后大动作：发布DSpark推理加速框架生成速度提升60

热门分类

DeepSeek首轮融资后大动作：发布DSpark推理加速框架 生成速度提升60

热门分类

DeepSeek首轮融资后大动作：发布DSpark推理加速框架生成速度提升60