【R1-Nature：在小模型上复现R1推理能力，探索强推理的核心——思考过程性

爱生活爱珂珂 2025-02-20 14:20:48

【R1-Nature：在小模型上复现R1推理能力，探索强推理的核心——思考过程性内容。亮点：1. 仅用0.5B到3B的小模型，成功复现R1推理效果；2. 提出“思维链推理爆炸”现象及解决方案；3. 通过实验验证，思考内容是AGI/ASI的核心】

'R1-Nature: The simplest R1 result reproduced on small models, demonstrating that the thinking process is the core of strong reasoning ability.'

GitHub: github.com/StarRing2022/R1-Nature

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

AI工程新标准：《AI Engineering》详解如何将foundation

2

NotebookLM API 正式开放，开启笔记管理与集成新篇章。 • 支持创

3

[人人能懂] 从数据炼金到思维融合都说AI要靠海量数据和巨大模型，但本期我们要聊

4

《EnvX: Agentize Everything with Agentic

5

[LG]《EvolKV: Evolutionary KV Cache Compr

6

[CL]《Verbalized Algorithms》S Lall, C Far

7

[LG]《Merge-of-Thought Distillation》Z She

8

[LG]《The More You Automate, the Less You

9

[LG]《Generative Data Refinement: Just As

10

早！[太阳] 早安

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

4

追觅造车了！造扫地机器人的那个追觅没想到啊，造车牌桌上一个接一个退场…这时候竟然

5

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

6

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

7

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

8

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

科技最新文章

1

据说华为Mate80长这样，辨识度和质感确实在线，今年的苹果17依旧差点意思，明

2

小屏党这次真的赢麻了！下个月要来的荣耀Magicicon8Mini，这配置看一

3

小米16系列背面酷似iphone17系列，背面上方是一个巨大的矩形摄像头deco

4

iPhone17最大的遗憾：没发现iPhoneAir最大的遗憾：单扬声器

5

最新消息马斯克突然宣布9月10日，马斯克突然宣布特斯拉正在敲定Optimus

6

荣耀吃了大补丸，堆料这么猛？好家伙钢铁侠的爆料真是吓人，荣耀Magic8Pro的

7

荣耀CEO李健首曝了荣耀Magic8，他表示这一代的Magic8系列，不仅具有最

8

iPhone17变成印度制造，瞬间觉得不香了苹果已将面向美国的iPhone

9

OPPO产品经理莫妮卡离职了，接下来极有可能的三个去处:1.加盟华为，与余承

10

iPhone17系列价格省流总结17系列，苹果近10年升级最大的一次，无论买哪