DC娱乐网

第一期比赛结束,Deepseek chat v3.1最后阶段还是败给了Qwen3

第一期比赛结束,Deepseek chat v3.1最后阶段还是败给了Qwen3 Max,拿到了比赛的第二名,最后盈利也不多了。 这一次比赛只有两个大语言模型实现了盈利,而且这两个还全部是国产的模型,这两个分别是 Qwen3 Max和 Deepseek chat v3.1。他们的收益率分别为+22.32%,+4.89%。分别赚了 $2,232 和 $489.08。 剩下的这四个就惨了,不仅赔钱,而且赔的还挺多,下面是明细。 - CLAUDE SONNET 4.5 亏了 30.81%, - GROK 4 亏了 45.3% - GEMINI 2.5 PRO 亏了 56.71% - GPT 5 亏了 62.66% 这样的结果怎么样?

评论列表

真实世界研究
真实世界研究 2
2025-11-04 20:01
都是后验概率。在全世界人都知道这个比赛之后,再重新来一次,结果会逆转。这就是先验概率。