大模型之家讯 近日,斯坦福AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华&面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5一事,在全网引发大量热议。
据悉,该事件起源于不久前的5月29日。彼时,一个斯坦福AI 团队在网络上高调宣传,只需500美元就可训练出一个超越GPT-4V 的 SOTA 多模态大模型。然而,不久后,有网友发现该模型的结构和代码与面壁智能不久前发布的MiniCPM-Llama3-V 2.5存在惊人的相似性,仅仅是部分变量名做了修改。
随着舆论的不断发酵,面壁智能团队于6月2日深夜正式对“被抄袭”事件做出了证实。他们指出:斯坦福的这个大模型项目不仅能像MiniCPM一样识别出“清华简”中的战国古文字,而且错误之处也完全相同。这些古文字数据是面壁智能团队花费数月时间从清华简上逐字扫描并人工标注的,并未对外公开。而这,也恰恰为抄袭一事提供了佐证。
北京时间6月4日凌晨1点27分,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg在 X 上就这一学术不端行为对面壁 MiniCPM 团队正式道歉。同时,其表示会将 Llama3-V 模型悉数撤下。
不过,值得一提的是,相似内容的道歉信在几小时前已被作者发布过一次,但随后被迅速删除。
谈及此事,面壁智能联合创始人刘知远表示,国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可,“这次事件也算侧面反映出,我们的创新成果也一直受到国际关注。”刘知远说。
原创文章,作者:欧 玉娇,如若转载,请注明出处:http://damoai.com.cn/archives/5603