DC娱乐网

看各种跑分结果,Qwen3.7-Max 的编程能力真的顶啊,有试过的吗?阿里有没

看各种跑分结果,Qwen3.7-Max 的编程能力真的顶啊,有试过的吗?阿里有没有什么Coding Plan?
千问团队自己发布的测评数据,全面碾压上一代模型 Qwen3.6-Plus, 而且基本上各项数据都超越了 Claude Opus-4.6 Max,更是脚踩Kimi K2.6,拳打GLM-5.1,Deepseek V4 Pro Max 也不是对手。
然后最近 Arena ai 也发布他们的测评结果,在前端代码测试中,Qwen3.7-Max 排名第四(图片上写的第三,也是草台班子)仅次于 Claude 的几个模型,但是我感觉这个有点假。

有试过 Qwen3.7-Max 的吗?推荐吗?

评论列表

用户14xxx19
用户14xxx19 1
2026-05-29 13:21
接口都没有
罗码工匠
罗码工匠 1
2026-05-30 08:41
国内的大模型甚至是汽车,甚至是别的很多行业发布产品的时候都是各种第一,这已经让用户麻木了,各种第一是谁评的?基于什么样的参数评比的?基于什么环境评比的,评比的题目是否规范?我现在看到这种动不动就得第一,全球第一,世界第一,地表最强,类似的评测结果真是感觉太浮夸了