OpenReasoning-Nemotron：NVIDIA发布一系列蒸馏推理大语

爱生活爱珂珂 2025-07-19 08:39:12

OpenReasoning-Nemotron：NVIDIA发布一系列蒸馏推理大语言模型，专注数学、科学与代码领域，推动推理能力研究迈向新高度。

• 基于DeepSeek R1 0528 671B模型蒸馏，涵盖1.5B、7B、14B、32B四种规模，性能领先同类模型。

• 训练数据由DeepSeek R1 0528生成，包含500万条高质量数学、科学和代码推理解决方案，数据及训练代码开放于NeMo-Skills。

• 多项权威推理基准测试表现卓越，32B模型在复杂数学与代码任务中刷新记录。

• 支持多代理并行生成与GenSelect方案，显著提升解题准确率，32B版本GenSelect准确率达96.7%（HMMT Feb 25）。

• 仅采用监督微调蒸馏，无强化学习，提供坚实基线，助力后续推理强化学习研究。

• 适合推理效率优化、定制任务微调及偏好优化研究，拓展推理模型应用边界。

模型与代码详见🔗 huggingface.co/blog/nvidia/openreasoning-nemotron

大语言模型人工智能机器学习推理模型开源AI

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

雾象（Fogsight）是由大型语言模型驱动的开源动画引擎，助力用户将抽象概念转

2

[人人能懂] 智能修炼手册：从AI前沿看穿成长与学习的底层逻辑

3

ARC-AGI-3 开发者预览发布，迈向 2026 年初全面版本• 专注于泛化能

4

ArchScale：微软推出的神经架构预训练一站式工具，专注架构设计与规模规律研

5

毕业生就业形势出现性别分化，男性大学生的就业优势正在消失，女性则相对稳健。• 男

6

人工智能是否会像人类一样受劝说原则影响？最新研究揭示了关键风险与机遇。• 研究对

7

Claude Agent：用 AI Agent 实现工作流效率提升十倍的秘密

8

概率统计与数据科学(Probability and Statistics for

9

OpenReasoning-Nemotron：NVIDIA发布一系列蒸馏推理大语

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

格力把高管送去火焰山猴哥都抹汗的地方朱总靠空调坚持了下来。😅孙悟空要是有这条

2

被董明珠说中了！内鬼作乱，国产芯片出了大问题，技术遭严重泄露，然而一查却发现，主

3

我有种预感，中国芯片行业要变天了。不是因为政策扶持，也不是技术突破，而是上海

4

罗永浩连怼网友罗永浩怎么了罗永浩连续发微博怼网友，他怎么了

5

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

6

一张值20万美元的H100芯片，被两个28岁的年轻人用新加坡和马来西亚做跳板偷偷

7

臻版回归！荣耀太狠了，这次看来是不准备留情面了！荣耀接下来最重磅的机型毫无疑问

8

大招继续！荣耀不藏了！Magic8再次迎来好消息！至臻版回归+卫星通信或成为

9

苹果公司第三财季财报太靓丽了，仅仅iPhone16的营业收入就达到了445亿美

10

红米新机Redmi15外观渲染图曝光：后置三摄采用纵向排列的矩形Deco今

科技最新文章

1

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

2

结合历代荣耀Magic系列的起售价格，预估一下荣耀Magic8的售价荣耀Ma

3

荣耀太狠了！全系最高降价1000元，直接把友商的饭碗给掀了啊荣耀Magic7

4

一加8000毫安新机来了，用的是全新骁龙芯片（8gen5），第一次听到这个命名，

5

刚传来的消息马斯克突然宣布了8月8日，马斯克宣布特斯拉将解散自己研发的Do

6

站哥一旦爆料，基本上已经是板上钉钉，没跑了！荣耀Magic8增加Ultra版！

7

荣耀Play10C发布4+128GB649；国补551.656+128GB

8

来北京亦庄看具身智能机器人北京范儿正在参加世界机器人大会，这应该代表了当今世界最

9

华为Mate70全系列官方指导价价格调整，渠道价等我更新，过两天部分机型会有不小

10

小米澎湃OS3爆料汇总，这无敌了吧？汇总网传澎湃OS3系统的爆料，小米这次真