美国的大模型公司 Anthropic 指责阿里巴巴利用大规模“蒸馏”来训练自己的通义千问大模型。
据称,阿里在今年 4 月到 6 月间,动用了 25,000 个账户大规模访问 Claude,生成了大约 3,000 万次交互,重点针对的是软件工程和代理推理能力。Anthropic 认为这是更广泛的对抗性蒸馏模式的一部分,称中国实验室从美国前沿模型中收割输出,以低成本训练自己的模型。
所谓“蒸馏”,说白了就是拿别人的顶级模型当老师,大规模地向它提问并收集回答,然后用这些回答来训练自己的模型。说好听点是站在巨人的肩膀上,说不好听这就是一种变相的抄袭。
但是 Anthropic 这个指责其实没有什么道理。
1. 准入门槛:Anthropic 在中国根本不提供服务,而且严格限制中国用户,包括对使用中国银行卡或支付宝支付、以及中国 IP 的账户进行大规模封禁。所以中国人很难直接使用 Claude。
2. 逻辑漏洞:你说阿里动用了 2 万多个账户去“蒸馏”你,那你当时为什么不指出来并封禁呢?2 万个账户不是小数目,背后的支付信息和后台数据 Anthropic 自己都掌握着。
你现在又跑出来指责,我觉得阿里是不太可能干出这种事来的。

评论列表