美国的大模型公司 Anthropic 指责阿里巴巴利用大规模“蒸馏”来训练自己的

美国的大模型公司 Anthropic 指责阿里巴巴利用大规模“蒸馏”来训练自己的通义千问大模型。
据称，阿里在今年 4 月到 6 月间，动用了 25,000 个账户大规模访问 Claude，生成了大约 3,000 万次交互，重点针对的是软件工程和代理推理能力。Anthropic 认为这是更广泛的对抗性蒸馏模式的一部分，称中国实验室从美国前沿模型中收割输出，以低成本训练自己的模型。
所谓“蒸馏”，说白了就是拿别人的顶级模型当老师，大规模地向它提问并收集回答，然后用这些回答来训练自己的模型。说好听点是站在巨人的肩膀上，说不好听这就是一种变相的抄袭。
但是 Anthropic 这个指责其实没有什么道理。
1. 准入门槛：Anthropic 在中国根本不提供服务，而且严格限制中国用户，包括对使用中国银行卡或支付宝支付、以及中国 IP 的账户进行大规模封禁。所以中国人很难直接使用 Claude。
2. 逻辑漏洞：你说阿里动用了 2 万多个账户去“蒸馏”你，那你当时为什么不指出来并封禁呢？2 万个账户不是小数目，背后的支付信息和后台数据 Anthropic 自己都掌握着。
你现在又跑出来指责，我觉得阿里是不太可能干出这种事来的。

DC娱乐网

美国的大模型公司 Anthropic 指责阿里巴巴利用大规模“蒸馏”来训练自己的

评论列表

热门分类