claude code的模型,确实得分比其它大模型略高一些。那是因为它收集了更多的编程交互数据,针对性的训练了模型。
比如,它收集到很多用户,使用某个开源项目出错的数据,之后,它就会知道,哪些做法用这个开源模型会出错。之后训练出来的大模型,就会避开这些坑,因此,它在编程领域的表现,自然会更好一点,刷分也会高一些。
用户的编程经验,本身就是珍贵的数据。因为用户试错的过程,其实就是问题解决的过程。有这些数据,当然可以改进模型的表现。
这就是动态数据优于静态数据,交互数据优于动态数据。最好的训练数据是交互数据。
但这并不是什么本质上的技术差距。是数据资源的差距而已,不是算法的差距。claude code拿到了第一手的编程训练资料,改进了大模型。
所以,国内的大模型厂家,也要去通过免费提供api调用等形式,收集编程训练数据,不然在大模型领域就会落后。
这方面,无疑deepseek已经领先了。现在全世界都在用deepseek。别以为美国人就不用。那个deepseek tui就是美国人写的,因为claude code美国人也用不起,所以他用claude code写了deepseek tui。
claude code本身没啥技术含量。代码助手不可能形成垄断。