Grok?3發布后,能否改寫以OpenAI、谷歌、Meta為核心的AI新秩序?
原標題:20萬卡吞金獸 Grok 3 炸裂登場,卡帕西大神親測:性能超過DeepSeek R1!馬斯克:短期不開源
文章來源:AI前線
內容字數:10045字
xAI發布Grok 3:挑戰LLM格局的超級AI模型
本文總結了xAI公司發布的新一代AI模型Grok 3及其mini版本的主要特點、性能表現和未來展望。
Grok 3的發布與目標
埃隆·馬斯克旗下xAI公司發布了新一代AI模型Grok 3和Grok 3-mini,馬斯克將其稱為“迄今為止最強大的AI模型”。Grok一詞源于科幻小說,意為“深刻理解”。xAI團隊耗時214天建成并擴建了包含20萬張英偉達GPU的Colossus超級計算機用于訓練Grok 3。其目標是完成現實世界中的復雜任務,例如制造特斯拉汽車、解決太空發射問題等,并預測未來兩年內AI將超越人類,實現科學突破。
Grok 3的性能與特點
Grok 3最顯著的特點是集成了推理能力,能夠在解決問題前進行思考。在數學、科學和編碼方面,Grok 3及其mini版本均表現優異,在多個基準測試中擊敗了其他競爭對手,例如在Arena測試中得分超過1400分,在AIME考試中取得93%的成績。Grok 3-mini的性能雖然略遜于Grok 3,但也優于其他主流模型。xAI還推出了DeepSearch,一種新型搜索引擎和Agent工具,能夠輔助編程和解答日常問題。
Grok 3的訂閱模式與未來規劃
Grok 3提供兩種訂閱模式:X平臺Premium+深度用戶和月費30美元/年費300美元的SuperGrok。xAI計劃在一周內上線語音模式,數周后為企業用戶提供包含DeepSearch的API接入方案,并在幾個月后對Grok 2進行開源。
Grok 3對Scaling Law的意義
Grok 3的發布被視為對Scaling Law的又一次驗證,其強大的算力支持(20萬張英偉達GPU,4億個GPU小時)遠超其他模型,這表明在LLM領域,Scaling Laws或許依然成立。Grok 3的成功也挑戰了“Scaling Law終結”的論調。
Grok 3的市場競爭力與爭議
雖然Grok 3在技術上表現出色,但在市場競爭力方面仍面臨挑戰。其市場份額遠不及ChatGPT,并且曾因訪問X平臺數據而產生偏見爭議。一些觀點認為,即使使用合成數據,Grok 3也難以與參數規模更大的競爭對手匹敵。然而,Grok 3與X平臺的原生集成以及獨特的編程方式使其在X用戶中頗受歡迎。
Grok系列模型的演進
Grok系列模型是xAI的核心產品,從Grok 1的合成數據訓練,到Grok 2的合成數據與真實數據結合,再到Grok 3的強大算力支持和推理能力集成,體現了xAI在AI模型發展上的持續改進和探索。
總而言之,Grok 3的發布是AI領域的一個重要,其強大的性能和獨特的特性使其成為一個值得關注的競爭者。然而,其能否最終躋身全球頂級模型之列,還需要時間的檢驗。
聯系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。