這家成立僅三年的深圳公司於1月20日發佈了名為DeepSeek-R1的新型AI模型。
1月24日,在國外大模型排名Arena上,DeepSeek-R1基準測試已經升至全類別大模型第三,其中在風格控制類模型(StyleCtrl)分類中與OpenAI o1並列第一。而其競技場得分達到1357分,略超 OpenAI o1 的1352分。
DeepSeek公眾號此前發佈消息稱:“DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。”
業內人士指出,DeepSeek在本土對衝基金支持下取得的成功是建立在開源知識的基礎上的。相比之下,美國競爭對手OpenAI最近則轉向了閉源運營模式。(這意味著,DeepSeek和Meta等公司向任何人——研究人員和業餘愛好者公開其知識,而OpenAI現在則將其信息作為專有信息)。
DeepSeek憑借高性能和低成本迅速崛起,其自研大模型R1通過強化學習技術在低標注數據環境下顯著提升推理能力,訓練成本僅為OpenAI的十分之一,運行成本低至三十分之一,被業界稱為“AI界的拼多多”。其開源模式推動AI技術普及,為醫療、金融、物流等領域提供了更廣闊的應用前景。業內普遍認為,DeepSeek的成功標誌著中國大模型技術邁入了新高度。