斯坦福研究团队抄袭中国大模型!删库跑路并道歉!

藕节传传 2024-06-05 11:41:13

近期,AI领域爆出了一起引起广泛关注的事件,涉及到斯坦福大学的一个研究团队和他们开发的名为Llama3-V的多模态大模型。这个模型因其卓越的性能和低成本训练要求而受到瞩目,宣称能在仅500美元的成本下实现超越当前市场上一些主流模型的能力。然而,随后的发展却让整个AI界哗然。

事情起因于一位细心网友的发现。他在对比分析后指出,Llama3-V的模型结构和代码与清华大学旗下的创业公司面壁智能推出的MiniCPM-Llama3-V 2.5惊人地相似。不仅模型架构几乎一致,连代码和配置文件也仅仅是变量名有所改变。这一发现迅速引起了社区的广泛关注和讨论。

面对外界的质疑,斯坦福团队最初的回应是,他们的工作是独立进行的,只是偶然与MiniCPM-Llama3-V 2.5在结构上类似,仅使用了原模型的tokenizer,并坚称在原作发布前已开始相关工作。但是随着更多证据浮出水面,包括两个模型在处理某些特定任务时的惊人一致性,这种解释开始显得力不从心。当具体的证据性质疑出现后,斯坦福团队最初的回应被迅速删除。

事实上,Llama3-V在某些未公开的内部数据处理上表现出的行为与MiniCPM-Llama3-V 2.5高度一致,这些特性本应该是MiniCPM-Llama3-V 2.5独有的,这进一步加深了外界对抄袭的怀疑。例如,两个模型在识别清华简这一特定数据集上的表现几乎一模一样,而这些数据并未公开,按理说只有MiniCPM-Llama3-V 2.5能正确处理。

面对越来越多的证据,斯坦福团队最终选择了将所有相关的项目资料从互联网上撤下,这个“删库跑路”的决定在社区中引发了混合反响。一方面,有人觉得这是一种默认的错误行为;另一方面,也有人认为这可能只是出于谨慎,避免在问题完全清楚之前引起更大的争议。

不过,目前该团队的两位创作者 Siddharth Sharma 和 Aksh Garg 已经在平台上发布了道歉信。此前几小时,他们曾发布过一封类似内容的道歉信,但很快被删除。

总说中国抄袭,抄袭这种情况在国外也一样存在!外国的月亮没那么圆!这次抄袭的对象还是我们中国的科技产业。面壁智能CEO也是开玩笑地表示,这也算是一种认可。

0 阅读:0

藕节传传

简介:感谢大家的关注