【R1-Nature:在小模型上复现R1推理能力,探索强推理的核心——思考过程性

爱生活爱珂珂 2025-02-20 14:20:48

【R1-Nature:在小模型上复现R1推理能力,探索强推理的核心——思考过程性内容。亮点:1. 仅用0.5B到3B的小模型,成功复现R1推理效果;2. 提出“思维链推理爆炸”现象及解决方案;3. 通过实验验证,思考内容是AGI/ASI的核心】

'R1-Nature: The simplest R1 result reproduced on small models, demonstrating that the thinking process is the core of strong reasoning ability.'

GitHub: github.com/StarRing2022/R1-Nature

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注