https://big5.sputniknews.cn/20240605/1059542495.html

斯坦福大學AI團隊抄襲中國大模型

俄羅斯衛星通訊社

據澎湃新聞報道，近日，由三位美國斯坦福大學學生組成的一個AI團隊發佈了開源模型Llama3-V，但很快被曝出與中國大模型公司面壁智能的開源成果MiniCPM-Llama3-V 2.5擁有幾乎完全相同的模型架構與代碼，引發“抄襲”質疑。當地時間6月3日，Llama3-V團隊的森德哈斯·沙瑪（Siddharth... 2024年6月5日, 俄羅斯衛星通訊社

2024-06-05T09:42+0800

美國

中國

人工智能

https://cdn.sputniknews.cn/img/102790/55/1027905513_0:147:1200:822_1920x0_80_0_0_bf308f1fe1486454b19948e0d7657ba3.jpg

在道歉信中，沙瑪和加格稱他們負責模型的宣發工作，該模型代碼的作者是穆斯塔法·阿爾賈德里（Mustafa Aljadery），但兩人在看到相關質疑後於6月2日詢問了阿爾賈德里，此後再也沒能聯繫上後者，於是決定發佈道歉聲明。目前，阿爾賈德里的X賬號顯示“僅好友可見”，Llama3-V模型也已經從Hugging Face等開源平台上下架。不過，加格還在發佈Llama3-V的Medium頁面上保留了一些描述和介紹，在開頭附上了道歉聲明。據瞭解，這場風波起源於5月29日。當日，斯坦福大學的一個研究團隊在開源社區中發佈了名為“Llama3-V”的模型，稱只要500美元（約合人民幣3622元）就能訓練出一個SOTA多模態模型，且效果比肩知名大模型GPT-4V、Gemini Ultra與Claude Opus。由於該團隊的三位作者都來自斯坦福大學，又擁有在特斯拉、SpaceX和亞馬遜等科技大廠的相關經歷，發佈該模型的X文章很快獲得超過30萬的瀏覽量，該模型也迅速在Hugging Face首頁的模型熱度名單上衝進前排。然而，不久後，開源社區內開始出現懷疑聲，質疑Llama3-V是在“套殼”面壁智能於今年5月中旬剛剛發佈的最新8B多模態小模型MiniCPM-Llama3-V 2.5，且沒有在項目中提到任何關於後者的信息。對此，Llama3-V團隊回應稱其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分詞器）”，並稱團隊在MiniCPM-Llama3-V 2.5發佈前就已經開始了這項工作。6月2日，網友pzc163在MiniCPM-V的Github頁面上對此事進行了還原，並列舉出大量的代碼證據。證據顯示，Llama3-V項目使用了與MiniCPM-Llama3-V 2.5項目基本完全相同的模型結構和代碼實現。另外，Hugging Face 發佈頁面上的歷史記錄顯示，Llama3-V的作者曾在該頁面上直接導入了MiniCPM-V的代碼，然後改名為Llama3-V。在Llama3-V團隊道歉前，面壁智能的聯合創始人兼CEO李大海在朋友圈發文回應，披露了Llama3-V能夠與MiniCPM一樣識別出“清華簡”戰國古文字的新證據，而由MiniCPM團隊掃描並人工批注的該古文字數據並未對外公開，證實了Llama3-V模型涉嫌抄襲。值得一提的是，斯坦福人工智能實驗室主任克里斯托弗·大衛·曼寧（Christopher David Manning）也在X平台上發文譴責這一抄襲行為，並稱MiniCPM“是很好的開源作品”。

https://big5.sputniknews.cn/20240428/1058695643.html

美國

俄羅斯衛星通訊社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

2024

俄羅斯衛星通訊社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

News

cn_CN

俄羅斯衛星通訊社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

1920

1080

true

1920

1440

true

https://cdn.sputniknews.cn/img/102790/55/1027905513_0:0:1200:900_1920x0_80_0_0_e96c958089f6b56bba58e70ff7ad7516.jpg

1920

true

俄羅斯衛星通訊社

feedback.cn@sputniknews.com

+74956456601

MIA „Rossiya Segodnya“

252

俄羅斯衛星通訊社

美國, 中國, 人工智能

斯坦福大學AI團隊抄襲中國大模型

2024年6月5日, 09:42

在道歉信中，沙瑪和加格稱他們負責模型的宣發工作，該模型代碼的作者是穆斯塔法·阿爾賈德里（Mustafa Aljadery），但兩人在看到相關質疑後於6月2日詢問了阿爾賈德里，此後再也沒能聯繫上後者，於是決定發佈道歉聲明。

目前，阿爾賈德里的X賬號顯示“僅好友可見”，Llama3-V模型也已經從Hugging Face等開源平台上下架。不過，加格還在發佈Llama3-V的Medium頁面上保留了一些描述和介紹，在開頭附上了道歉聲明。

據瞭解，這場風波起源於5月29日。當日，斯坦福大學的一個研究團隊在開源社區中發佈了名為“Llama3-V”的模型，稱只要500美元（約合人民幣3622元）就能訓練出一個SOTA多模態模型，且效果比肩知名大模型GPT-4V、Gemini Ultra與Claude Opus。

由於該團隊的三位作者都來自斯坦福大學，又擁有在特斯拉、SpaceX和亞馬遜等科技大廠的相關經歷，發佈該模型的X文章很快獲得超過30萬的瀏覽量，該模型也迅速在Hugging Face首頁的模型熱度名單上衝進前排。

然而，不久後，開源社區內開始出現懷疑聲，質疑Llama3-V是在“套殼”面壁智能於今年5月中旬剛剛發佈的最新8B多模態小模型MiniCPM-Llama3-V 2.5，且沒有在項目中提到任何關於後者的信息。對此，Llama3-V團隊回應稱其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分詞器）”，並稱團隊在MiniCPM-Llama3-V 2.5發佈前就已經開始了這項工作。

6月2日，網友pzc163在MiniCPM-V的Github頁面上對此事進行了還原，並列舉出大量的代碼證據。

證據顯示，Llama3-V項目使用了與MiniCPM-Llama3-V 2.5項目基本完全相同的模型結構和代碼實現。另外，Hugging Face 發佈頁面上的歷史記錄顯示，Llama3-V的作者曾在該頁面上直接導入了MiniCPM-V的代碼，然後改名為Llama3-V。

在Llama3-V團隊道歉前，面壁智能的聯合創始人兼CEO李大海在朋友圈發文回應，披露了Llama3-V能夠與MiniCPM一樣識別出“清華簡”戰國古文字的新證據，而由MiniCPM團隊掃描並人工批注的該古文字數據並未對外公開，證實了Llama3-V模型涉嫌抄襲。

李大海表示，團隊對這件事深表遺憾：“我們希望團隊的好工作被更多人關注與認可，但不是以這種方式……一方面感慨這也是一種受到國際團隊認可的方式，另一方面呼籲大家共建開放、合作、有信任的社區環境。”

值得一提的是，斯坦福人工智能實驗室主任克里斯托弗·大衛·曼寧（Christopher David Manning）也在X平台上發文譴責這一抄襲行為，並稱MiniCPM“是很好的開源作品”。

中國首個Sora級視頻大模型Vidu發佈

2024年4月28日, 07:34