华为魔改DeepSeek精度效率双提升让AI提前停止推理反而更优大模型推理越来越

量子位看科技 2025-05-11 23:26:27

华为魔改DeepSeek精度效率双提升让AI提前停止推理反而更优

大模型推理越来越强,但也可能“想太多”,导致效率低、结论错。

华为联合中科院信工,选用不同规模的DeepSeek-R1-Distill-Qwen模型(1.5B, 7B, 14B, 32B),魔改出新方法DEER,能让模型在信息足够时“及时收手”。

DEER的关键是识别思维链中最有价值的临界点(Pearl Reasoning),在这个点就让模型提前结束推理、直接给出答案。实验表明:这种提前退出不仅提高准确率,还能减少31%到43%的生成长度。

研究发现,很多问题并不需要完整的推理链。比如在MATH-500数据集里,仅用20%的推理步骤就能保持60.8%的准确率。而GPQA这种更复杂的数据集,也有35.1%的样本能在少于一半路径时答对。

传统的固定退出点策略不够灵活,因此研究者设计了动态退出机制 DEER。它通过三步来判断退出时机:

1. 监控推理中出现的思路转换点(如“wait”等词);

2. 在这些点强制诱导生成一个“试验性答案”;

3. 如果答案的置信度高,就提前终止思考;否则继续推理。

为了提高效率,DEER还引入了“分支并行”机制,让诱导、评估和推理并行进行,减少额外时延。

实际测试显示,DEER在多个benchmark和不同规模模型上都有效,准确率提升1.7-5.7个百分点,生成长度减少三分之一以上。尤其在人类代码生成任务中,生成长度减半,准确率还涨了。

0 阅读:30
量子位看科技

量子位看科技

感谢大家的关注