【[2.6k星]Agentica-project/rllm：让强化学习（RL）变

爱生活爱珂珂 2025-04-10 13:54:00

【[2.6k星]Agentica-project/rllm：让强化学习（RL）变得大众化，为大语言模型（LLM）提供强大的训练支持。亮点：1. 开源完整的训练脚本和模型，包括超参数设置；2. DeepCoder-14B模型在LiveCodeBench上达到60.6%的通过率，与O3-mini水平相当；3. 提供完整的训练日志和评估记录，方便复现和研究】

'rLLM: Democratizing Reinforcement Learning for LLMs'

GitHub: github.com/agentica-project/rllm

强化学习大语言模型开源项目 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【a16z的AI avatar概览：AI avatar（虚拟化身/数字人）技术近

2

【Deep Cogito 正在推出 Cogito v1 Preview，这是一系

3

【Anthropic Education Report：这份报告深入分析了大学生

4

冲到第三了！[嘻嘻] 图二可5折下单签名版，感谢支持！

5

早！[太阳] 早安

6

晚安～ [月亮] 晚安

7

【[22星]WarpConvNet：让3D深度学习架构梦想成真的高性能库。亮点：

8

【[75星]OpenArm：一款开源的类人机械臂，专为AI和机器人研究设计，助力

9

【[492星]DevDocs：为开发者打造的完全免费、私有的技术文档MCP服务器

10

【[289星]pdf-document-layout-analysis：一个强大

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

3

小米又搞大动作啦！6月24日雷军透露小米YU7支持车外小爱语音。车外配备8个麦克

4

小米首款智能眼镜AIGlasses发布，支持拍照录像和超级小爱同学。1999起

5

朝鲜的单摄奥利奥，虽然只是一个很low的后摄单摄，但是也要凑够两个假的组成奥利奥

6

小米深圳总部今日正式开园都说小米之家只有60米高是“矮楼”，但是没人觉得造型很像

7

雷军估计不会再直播了！他怎么也想不到，网友居然在他直播间里干起来了！甚至把雷

8

陈震再次质疑小米YU7到底极限在哪里？到现在为止，他已经连续发了四篇专门的文

9

不得不说，这老头也太幸福了吧！国外的科技都这么先进了吗？这两位美女机器人做的

10

一万买的华为pura80pro+还没捂热夫妻吵架给砸了一个老主顾半夜联系我

科技最新文章

1

绝了，国产中端机真的牛，10000mAh大电池即将出场，续航霸王实锤了。苹果彻底

2

第二款骁龙8Elite2也来了，一加15比想象中的要强大！索尼大底长焦方

3

荣耀Magic6，刚升级完最新版本，这次主要是相机和AI办公的升级。刚升

4

感觉手机买早了，肠子悔青了，荣耀X70早点发布该有多好两千以内可以买到8300

5

还是自研芯片有底气，采用了玄戒O1的小米15SPro手机给芯片性能面板

6

重大消息，荣耀Magic7系列迎来了又一次重磅系统更新这次的182版本主要加入

7

小米深圳总部今日正式开园都说小米之家只有60米高是“矮楼”，但是没人觉得造型很像

8

荣耀X70在千元机档位有三大特性是领先的，确实超出我个人预期：1.设计耐看；2.

9

吊打苹果，吊打三星，华为也要加油了！你以为8300毫安荣耀X70是电池终点？

10

说实话，荣耀X70手机，8300的电池挺吸引人的。不过，骁龙6Gen4芯片让人纠