斯坦福大學AI團隊抄襲中國大模型

© Depositphotos.com / agsandrew斯坦福大學AI團隊抄襲中國大模型
斯坦福大學AI團隊抄襲中國大模型 - 俄羅斯衛星通訊社, 1920, 05.06.2024
關注
據澎湃新聞報道,近日,由三位美國斯坦福大學學生組成的一個AI團隊發佈了開源模型Llama3-V,但很快被曝出與中國大模型公司面壁智能的開源成果MiniCPM-Llama3-V 2.5擁有幾乎完全相同的模型架構與代碼,引發“抄襲”質疑。當地時間6月3日,Llama3-V團隊的森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台X上發佈文章,向MiniCPM團隊正式道歉,表示會將Llama3-V模型從網絡上撤下。
在道歉信中,沙瑪和加格稱他們負責模型的宣發工作,該模型代碼的作者是穆斯塔法·阿爾賈德里(Mustafa Aljadery),但兩人在看到相關質疑後於6月2日詢問了阿爾賈德里,此後再也沒能聯繫上後者,於是決定發佈道歉聲明。
目前,阿爾賈德里的X賬號顯示“僅好友可見”,Llama3-V模型也已經從Hugging Face等開源平台上下架。不過,加格還在發佈Llama3-V的Medium頁面上保留了一些描述和介紹,在開頭附上了道歉聲明。
據瞭解,這場風波起源於5月29日。當日,斯坦福大學的一個研究團隊在開源社區中發佈了名為“Llama3-V”的模型,稱只要500美元(約合人民幣3622元)就能訓練出一個SOTA多模態模型,且效果比肩知名大模型GPT-4V、Gemini Ultra與Claude Opus。
由於該團隊的三位作者都來自斯坦福大學,又擁有在特斯拉、SpaceX和亞馬遜等科技大廠的相關經歷,發佈該模型的X文章很快獲得超過30萬的瀏覽量,該模型也迅速在Hugging Face首頁的模型熱度名單上衝進前排。
然而,不久後,開源社區內開始出現懷疑聲,質疑Llama3-V是在“套殼”面壁智能於今年5月中旬剛剛發佈的最新8B多模態小模型MiniCPM-Llama3-V 2.5,且沒有在項目中提到任何關於後者的信息。對此,Llama3-V團隊回應稱其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer(分詞器)”,並稱團隊在MiniCPM-Llama3-V 2.5發佈前就已經開始了這項工作。
6月2日,網友pzc163在MiniCPM-V的Github頁面上對此事進行了還原,並列舉出大量的代碼證據。
證據顯示,Llama3-V項目使用了與MiniCPM-Llama3-V 2.5項目基本完全相同的模型結構和代碼實現。另外,Hugging Face 發佈頁面上的歷史記錄顯示,Llama3-V的作者曾在該頁面上直接導入了MiniCPM-V的代碼,然後改名為Llama3-V。
在Llama3-V團隊道歉前,面壁智能的聯合創始人兼CEO李大海在朋友圈發文回應,披露了Llama3-V能夠與MiniCPM一樣識別出“清華簡”戰國古文字的新證據,而由MiniCPM團隊掃描並人工批注的該古文字數據並未對外公開,證實了Llama3-V模型涉嫌抄襲。
李大海表示,團隊對這件事深表遺憾:“我們希望團隊的好工作被更多人關注與認可,但不是以這種方式……一方面感慨這也是一種受到國際團隊認可的方式,另一方面呼籲大家共建開放、合作、有信任的社區環境。”
值得一提的是,斯坦福人工智能實驗室主任克里斯托弗·大衛·曼寧(Christopher David Manning)也在X平台上發文譴責這一抄襲行為,並稱MiniCPM“是很好的開源作品”。
人工智能(AI) - 俄羅斯衛星通訊社, 1920, 28.04.2024
中國首個Sora級視頻大模型Vidu發佈
新聞時間線
0