《自然》發文：中國廉價、開放的人工智能模型DeepSeek讓科學家們興奮不已

原標題：《自然》發文：中國廉價、開放的人工智能模型DeepSeek讓科學家們興奮不已
文章來源：人工智能學家
內容字數：16062字

本文報道了中國初創公司DeepSeek發布的大型語言模型DeepSeek-R1，其性能與OpenAI的o1相當，但價格卻低廉許多，且對研究人員開放，引發了全球科學家的興奮。

DeepSeek-R1在化學、數學和編碼等任務上的表現與OpenAI的o1不相上下，甚至在某些方面超越了o1。然而，其使用成本卻只有o1的三十分之一，這使得更多研究人員能夠負擔得起使用該模型進行研究。

與OpenAI的封閉模型不同，DeepSeek-R1以“開放權重”的方式發布，研究人員可以研究和改進其算法，這極大地促進了AI研究的開放性和合作性。雖然訓練數據尚未公開，但MIT許可證下的重用也為研究提供了極大的便利。

DeepSeek-R1的成功，尤其是在美國出口管制限制下取得的成就，表明高效的資源利用比單純的計算規模更重要。這挑戰了美國在AI領域的領先地位，也暗示著全球AI競爭格局的轉變。

DeepSeek-R1與o1一樣，采用“思維鏈”方法，能夠逐步生成響應，模擬人類推理過程，從而更好地解決復雜科學問題。DeepSeek通過強化學習對模型進行微調，進一步提升了其推理和解決問題的能力。

DeepSeek-R1在一些基準測試中取得了與o1相當甚至更好的成績。更重要的是，其開放性使得研究人員可以訪問其“思維鏈”，從而更好地理解模型的推理過程，提高了模型的可解釋性。

DeepSeek-R1的出現標志著中國在大型語言模型領域取得了重大突破，其低廉的價格和開放性將極大地推動AI在科學研究和各個領域的應用普及，并有望改變全球AI競爭格局。

文章還提及DeepSeek公司此前發布的機器人V3也表現出色，以及DeepSeek在有限預算下取得的成就，進一步印證了其在AI領域的技術實力和創新能力。研究人員已經開始利用DeepSeek-R1進行各種科學研究，并取得了令人印象深刻的結果。

聯系作者

文章來源：人工智能學家
作者微信：
作者簡介：致力成為權威的人工智能科技媒體和前沿科技研究機構

文章版權歸作者所有，未經允許請勿轉載。

暫無評論...