DC娱乐网

GLM-5.2 在学术论文复现上,夯爆了!

在学术复现测试中,开源大模型 GLM 5.2 展现出极高性价比。

科研平台 alphaXiv 团队使用自动化代理测试大模型复现前沿论文的能力。

在复现自蒸馏强化学习论文 SDPO 时,GLM 5.2 产生的运行成本仅为闭源旗舰模型 Claude Opus 4.8 Max 的约八分之一。

实验要求模型自主阅读论文、排查开源库 VeRL 复杂的环境报错并跑完消融实验。

GLM 5.2 经历 14 次运行失败后成功复现,消耗 265 万 tokens,总花费 6.21 美元。

Claude Opus 4.8 经历 9 次失败后成功,消耗 453 万 tokens,花费达 46.35 美元。

不得不说,最近这国产模型一个赛一个强啊~