斯坦福研究团队抄袭中国大模型！删库跑路并道歉！

近期，AI领域爆出了一起引起广泛关注的事件，涉及到斯坦福大学的一个研究团队和他们开发的名为Llama3-V的多模态大模型。这个模型因其卓越的性能和低成本训练要求而受到瞩目，宣称能在仅500美元的成本下实现超越当前市场上一些主流模型的能力。然而，随后的发展却让整个AI界哗然。

事情起因于一位细心网友的发现。他在对比分析后指出，Llama3-V的模型结构和代码与清华大学旗下的创业公司面壁智能推出的MiniCPM-Llama3-V 2.5惊人地相似。不仅模型架构几乎一致，连代码和配置文件也仅仅是变量名有所改变。这一发现迅速引起了社区的广泛关注和讨论。

面对外界的质疑，斯坦福团队最初的回应是，他们的工作是独立进行的，只是偶然与MiniCPM-Llama3-V 2.5在结构上类似，仅使用了原模型的tokenizer，并坚称在原作发布前已开始相关工作。但是随着更多证据浮出水面，包括两个模型在处理某些特定任务时的惊人一致性，这种解释开始显得力不从心。当具体的证据性质疑出现后，斯坦福团队最初的回应被迅速删除。

事实上，Llama3-V在某些未公开的内部数据处理上表现出的行为与MiniCPM-Llama3-V 2.5高度一致，这些特性本应该是MiniCPM-Llama3-V 2.5独有的，这进一步加深了外界对抄袭的怀疑。例如，两个模型在识别清华简这一特定数据集上的表现几乎一模一样，而这些数据并未公开，按理说只有MiniCPM-Llama3-V 2.5能正确处理。

面对越来越多的证据，斯坦福团队最终选择了将所有相关的项目资料从互联网上撤下，这个“删库跑路”的决定在社区中引发了混合反响。一方面，有人觉得这是一种默认的错误行为；另一方面，也有人认为这可能只是出于谨慎，避免在问题完全清楚之前引起更大的争议。

不过，目前该团队的两位创作者 Siddharth Sharma 和 Aksh Garg 已经在平台上发布了道歉信。此前几小时，他们曾发布过一封类似内容的道歉信，但很快被删除。

总说中国抄袭，抄袭这种情况在国外也一样存在！外国的月亮没那么圆！这次抄袭的对象还是我们中国的科技产业。面壁智能CEO也是开玩笑地表示，这也算是一种认可。

DC生肖网

斯坦福研究团队抄袭中国大模型！删库跑路并道歉！

藕节传传