查看: 554|回复: 0

[IT与科技] 斯坦福抄袭中国AI大模型 露馅 急道歉删除

[复制链接]

3万

主题

4万

帖子

12万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
129513
发表于 2024-6-6 20:28:26 | 显示全部楼层 |阅读模式
美国斯坦福大学一AI团队发布了名为Llama3-V的多模态大模型,但随后,该团队发布的模型因为一个暗藏的“清华简”彩蛋,被发现其模型抄袭自中国大模型。 目前,该团队已公开道歉,并删除了相关库和官宣推文。
每日经济新闻报道,斯坦福大学AI团队在2024年5月29日发布了一个名为Llama3-V的多模态大模型,声称只需500美元(约3619元人民币)就能训练出一个性能可与GPT4-V媲美的模型。 Llama3-V不仅在社交媒体上迅速蹿红,还一度冲上了HuggingFace趋势榜首页。

然而,一名细心网友发现,该团队发布的Llama3-V和中国国内大模型MiniCPM-Llama3-V 2.5有极高的相似度,后者是由中国大模型初创企业“面壁智能”和清华大学自然语言处理实验室联合推出的。 该网友表示,这两个模型的结构、代码、配置文件都一模一样,只有变量名被替换了。
面壁智能首席科学家、清华大学长聘副教授刘知远随后在知乎上回应,MiniCPM-Llama3-V 2.5在研发时内置了一个彩蛋,就是对“清华简”的识别能力,而Llama3-V模型居然也有一模一样的能力。
清华简是清华大学于2008年7月收藏的一批战国竹简,为战国中晚期文物。 刘知远透露,识别清华简是MiniCPM-Llama3-V 2.5的一项实验功能,训练图像是最近从出土文物中扫描并标注,且尚未公开发布。
报道指出,遭到大量质疑后,该斯坦福团队成员已删除他们在X平台上官宣模型的推文,并将该项目在Github和HuggingFace上的相关库一并删除。
Llama3-V团队的森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)4日在社交平台上,就这一学术不端行为向面壁智能MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。
阿克沙表示,为这个项目编写代码的穆斯塔法(Mustafa)已无法联系。 他们查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。 他们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。
面壁智能CEO李大海3日表达了对此事的深切遗憾,他指出,尽管从某种程度上看,这种模仿可以被视为他们的成果得到了国际团队的某种认可,但他更强调应该构建一个开放、协作且充满信任的技术社区环境。 他们希望团队的努力和优秀工作能够吸引更多人的关注和认可,但并非以这种被模仿甚至抄袭的方式。

【郑重声明】荷顿论坛刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经本网同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表