看到 X 上一位老哥对比 GLM-5.2 和 Opus4.8,逗死我了。
老哥这两天一直听大家喊,搞同样的编程任务,中国的 GLM 比 Opus4.8 省钱到爆,然后他也去试了一下。
Opus 把代码构建错了,然后带着这个错误反复测试,最后硬是带伤把程序写出来了。
而 GLM 用干净的代码写出了整个程序。
有意思的是,仔细检查发现,GLM 使用的 Token 数量是 Opus 的两倍,但是花费的成本却只有 Opus 的一半。
老哥估计,GLM 之所以小号更多 Token,是因为它花精力验证了代码的正确性。在训练的时候,它就是这样被训练的:一定要检查代码正确性。
他改开:检查这么仔细,收费却只有 Opus 的一半儿,GLM 好样的!
