DC娱乐网

GLM-5.2 在学术论文复现上，夯爆了！

2026-06-28 02:20:31 智能机器之心科技

在学术复现测试中，开源大模型 GLM 5.2 展现出极高性价比。

科研平台 alphaXiv 团队使用自动化代理测试大模型复现前沿论文的能力。

在复现自蒸馏强化学习论文 SDPO 时，GLM 5.2 产生的运行成本仅为闭源旗舰模型 Claude Opus 4.8 Max 的约八分之一。

实验要求模型自主阅读论文、排查开源库 VeRL 复杂的环境报错并跑完消融实验。

GLM 5.2 经历 14 次运行失败后成功复现，消耗 265 万 tokens，总花费 6.21 美元。

Claude Opus 4.8 经历 9 次失败后成功，消耗 453 万 tokens，花费达 46.35 美元。

不得不说，最近这国产模型一个赛一个强啊~

阅读：0 点赞：0

猜你喜欢

浙江一高考生徐同学，数学考了满分，可以说是技惊四座。据他们小区邻居说，孩子早就被

浙江一高考生徐同学，数学考了满分，可以说是技惊四座。据他们小区邻居说，孩子早就被

2026-06-26 国际总览君

标签：数学浙江技惊四座清华大学

普京在瓦尔代湖的一座别墅已被拆除，但原因会让你笑出声。这座建筑可能是因为担心乌克

普京在瓦尔代湖的一座别墅已被拆除，但原因会让你笑出声。这座建筑可能是因为担心乌克

2026-06-26 光辉说世界

标签：瓦尔代别墅

成绩一公示的那刻，四川理科的家长群先静了一秒，随后是齐刷刷的长叹。600分以上

成绩一公示的那刻，四川理科的家长群先静了一秒，随后是齐刷刷的长叹。600分以上

2026-06-26 叮叮猫酱

标签：四川四川省

这或许就是做公务员的好处。

2026-06-26 浩梓聊社会

标签：公务员

656分！这分数搁在别人家估计早就摆酒庆祝了，但我家今晚的空气，硬是憋屈得能捏

656分！这分数搁在别人家估计早就摆酒庆祝了，但我家今晚的空气，硬是憋屈得能捏

2026-06-27 阿亮笑谈趣事

标签：英语

在教育投诉满天飞的时代，教师的权利还剩下多少？十多年前，还有家长质疑教师按收礼

在教育投诉满天飞的时代，教师的权利还剩下多少？十多年前，还有家长质疑教师按收礼

2026-06-27 教吖生态

标签：教师

贺永辉成了湖南高校的香饽饽了，不仅多所学校公开发出邀约。湖南科技大学更是抢先一步

贺永辉成了湖南高校的香饽饽了，不仅多所学校公开发出邀约。湖南科技大学更是抢先一步

2026-06-26 欣嘉优雅小姐不优雅

标签：湖南科技大学招生湘潭大学大学

武汉大学招生遇冷？开国际玩笑！有点常识的人，一看就是假的。人家武汉大学还会跑到

武汉大学招生遇冷？开国际玩笑！有点常识的人，一看就是假的。人家武汉大学还会跑到

2026-06-27 长空飞过鹰

标签：武汉大学招生