DC娱乐网

之前看到的评测都是说开源模型的优势在于性价比,低成本+还不错的质量,只看性能还是

之前看到的评测都是说开源模型的优势在于性价比,低成本+还不错的质量,只看性能还是GPT/Claude最强。而Faros 公司最近做的一个测试结论和其他的很不一样。。结论是开源模型最强。

他们用公司内部真实工程任务做了一次模型路由实验:从 12 个代码仓库中筛出 211 个严格任务,比较 7 种“模型 + 编程工具框架”组合在代码质量、成本、速度、缓存命中和稳定性上的表现。

结果显示,Claude Code + GLM-5.2 与 Claude Code + Kimi K2.6 进入最高质量区间,其中 GLM-5.2 的质量和 Kimi差不多打平,但平均更快、单任务成本更低。而Claude Code + Opus 4.8 和 Codex + GPT-5.5 在这批任务中并没有因为更贵就带来更好的综合结果。

同时他们还总结了不同类型的任务应该优先用哪个模型(图2),图上的缩写CG = Claude Code + GLM-5.2CK = Claude Code + Kimi K2.6OG = OpenCode + GLM-5.2OK = OpenCode + Kimi K2.6CO = Claude Code + Opus 4.8OO = OpenCode + Opus 4.8Codex = Codex + GPT-5.5

原文链接:www.faros.ai/blog/open-models-vs-frontier-modelsHow I AI