近日,斯坦福AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华&面壁智能的开源模型小钢炮MiniCPM-Llama3-V 2.5一事,在网络和媒体上引发热议。
事件起源于5月29日,一个斯坦福AI 团队在网络上高调宣传,只需500美元就可训练出一个超越GPT-4V 的 SOTA 多模态大模型。随后,被网友发现,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人相似,仅修改了部分变量名。
6月2日深夜,面壁智能团队证实,该斯坦福大模型项目与MiniCPM一样,可以识别出清华简战国古文字,不仅对得一模一样、连错得都一模一样。且这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。
今早北京时间凌晨1点27分,此事件迎来终局:斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg在 X 上就这一学术不端行为对面壁 MiniCPM 团队正式道歉, 表示会将 Llama3-V 模型悉数撤下。相似内容的道歉信,已于几小时前被作者发出一次,但被迅速删除。