https://sputniknews.cn/20240605/1059542495.html

斯坦福大学AI团队抄袭中国大模型

俄罗斯卫星通讯社

据澎湃新闻报道，近日，由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V，但很快被曝出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有几乎完全相同的模型架构与代码，引发“抄袭”质疑。当地时间6月3日，Llama3-V团队的森德哈斯·沙玛（Siddharth... 2024年6月5日, 俄罗斯卫星通讯社

2024-06-05T09:42+0800

美国

中国

人工智能

https://cdn.sputniknews.cn/img/102790/55/1027905513_0:147:1200:822_1920x0_80_0_0_bf308f1fe1486454b19948e0d7657ba3.jpg

在道歉信中，沙玛和加格称他们负责模型的宣发工作，该模型代码的作者是穆斯塔法·阿尔贾德里（Mustafa Aljadery），但两人在看到相关质疑后于6月2日询问了阿尔贾德里，此后再也没能联系上后者，于是决定发布道歉声明。目前，阿尔贾德里的X账号显示“仅好友可见”，Llama3-V模型也已经从Hugging Face等开源平台上下架。不过，加格还在发布Llama3-V的Medium页面上保留了一些描述和介绍，在开头附上了道歉声明。据了解，这场风波起源于5月29日。当日，斯坦福大学的一个研究团队在开源社区中发布了名为“Llama3-V”的模型，称只要500美元（约合人民币3622元）就能训练出一个SOTA多模态模型，且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学，又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历，发布该模型的X文章很快获得超过30万的浏览量，该模型也迅速在Hugging Face首页的模型热度名单上冲进前排。然而，不久后，开源社区内开始出现怀疑声，质疑Llama3-V是在“套壳”面壁智能于今年5月中旬刚刚发布的最新8B多模态小模型MiniCPM-Llama3-V 2.5，且没有在项目中提到任何关于后者的信息。对此，Llama3-V团队回应称其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分词器）”，并称团队在MiniCPM-Llama3-V 2.5发布前就已经开始了这项工作。6月2日，网友pzc163在MiniCPM-V的Github页面上对此事进行了还原，并列举出大量的代码证据。证据显示，Llama3-V项目使用了与MiniCPM-Llama3-V 2.5项目基本完全相同的模型结构和代码实现。另外，Hugging Face 发布页面上的历史记录显示，Llama3-V的作者曾在该页面上直接导入了MiniCPM-V的代码，然后改名为Llama3-V。在Llama3-V团队道歉前，面壁智能的联合创始人兼CEO李大海在朋友圈发文回应，披露了Llama3-V能够与MiniCPM一样识别出“清华简”战国古文字的新证据，而由MiniCPM团队扫描并人工批注的该古文字数据并未对外公开，证实了Llama3-V模型涉嫌抄袭。值得一提的是，斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁（Christopher David Manning）也在X平台上发文谴责这一抄袭行为，并称MiniCPM“是很好的开源作品”。

https://sputniknews.cn/20240428/1058695643.html

美国

俄罗斯卫星通讯社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

2024

俄罗斯卫星通讯社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

新闻

cn_CN

俄罗斯卫星通讯社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

1920

1080

true

1920

1440

true

https://cdn.sputniknews.cn/img/102790/55/1027905513_0:0:1200:900_1920x0_80_0_0_e96c958089f6b56bba58e70ff7ad7516.jpg

1920

true

俄罗斯卫星通讯社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

俄罗斯卫星通讯社

美国, 中国, 人工智能

斯坦福大学AI团队抄袭中国大模型

2024年6月5日, 09:42

在道歉信中，沙玛和加格称他们负责模型的宣发工作，该模型代码的作者是穆斯塔法·阿尔贾德里（Mustafa Aljadery），但两人在看到相关质疑后于6月2日询问了阿尔贾德里，此后再也没能联系上后者，于是决定发布道歉声明。

目前，阿尔贾德里的X账号显示“仅好友可见”，Llama3-V模型也已经从Hugging Face等开源平台上下架。不过，加格还在发布Llama3-V的Medium页面上保留了一些描述和介绍，在开头附上了道歉声明。

据了解，这场风波起源于5月29日。当日，斯坦福大学的一个研究团队在开源社区中发布了名为“Llama3-V”的模型，称只要500美元（约合人民币3622元）就能训练出一个SOTA多模态模型，且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。

由于该团队的三位作者都来自斯坦福大学，又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历，发布该模型的X文章很快获得超过30万的浏览量，该模型也迅速在Hugging Face首页的模型热度名单上冲进前排。

然而，不久后，开源社区内开始出现怀疑声，质疑Llama3-V是在“套壳”面壁智能于今年5月中旬刚刚发布的最新8B多模态小模型MiniCPM-Llama3-V 2.5，且没有在项目中提到任何关于后者的信息。对此，Llama3-V团队回应称其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分词器）”，并称团队在MiniCPM-Llama3-V 2.5发布前就已经开始了这项工作。

6月2日，网友pzc163在MiniCPM-V的Github页面上对此事进行了还原，并列举出大量的代码证据。

证据显示，Llama3-V项目使用了与MiniCPM-Llama3-V 2.5项目基本完全相同的模型结构和代码实现。另外，Hugging Face 发布页面上的历史记录显示，Llama3-V的作者曾在该页面上直接导入了MiniCPM-V的代码，然后改名为Llama3-V。

在Llama3-V团队道歉前，面壁智能的联合创始人兼CEO李大海在朋友圈发文回应，披露了Llama3-V能够与MiniCPM一样识别出“清华简”战国古文字的新证据，而由MiniCPM团队扫描并人工批注的该古文字数据并未对外公开，证实了Llama3-V模型涉嫌抄袭。

李大海表示，团队对这件事深表遗憾：“我们希望团队的好工作被更多人关注与认可，但不是以这种方式……一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。”

值得一提的是，斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁（Christopher David Manning）也在X平台上发文谴责这一抄袭行为，并称MiniCPM“是很好的开源作品”。

中国首个Sora级视频大模型Vidu发布

2024年4月28日, 07:34