20萬卡吞金獸 Grok 3 炸裂登場,卡帕西大神親測:性能超過DeepSeek R1!馬斯克:短期不開源
Grok?3發(fā)布后,能否改寫以OpenAI、谷歌、Meta為核心的AI新秩序?
原標(biāo)題:20萬卡吞金獸 Grok 3 炸裂登場,卡帕西大神親測:性能超過DeepSeek R1!馬斯克:短期不開源
文章來源:AI前線
內(nèi)容字?jǐn)?shù):10045字
xAI發(fā)布Grok 3:挑戰(zhàn)LLM格局的超級AI模型
本文總結(jié)了xAI公司發(fā)布的新一代AI模型Grok 3及其mini版本的主要特點(diǎn)、性能表現(xiàn)和未來展望。
Grok 3的發(fā)布與目標(biāo)
埃隆·馬斯克旗下xAI公司發(fā)布了新一代AI模型Grok 3和Grok 3-mini,馬斯克將其稱為“迄今為止最強(qiáng)大的AI模型”。Grok一詞源于科幻小說,意為“深刻理解”。xAI團(tuán)隊(duì)耗時214天建成并擴(kuò)建了包含20萬張英偉達(dá)GPU的Colossus超級計(jì)算機(jī)用于訓(xùn)練Grok 3。其目標(biāo)是完成現(xiàn)實(shí)世界中的復(fù)雜任務(wù),例如制造特斯拉汽車、解決太空發(fā)射問題等,并預(yù)測未來兩年內(nèi)AI將超越人類,實(shí)現(xiàn)科學(xué)突破。
Grok 3的性能與特點(diǎn)
Grok 3最顯著的特點(diǎn)是集成了推理能力,能夠在解決問題前進(jìn)行思考。在數(shù)學(xué)、科學(xué)和編碼方面,Grok 3及其mini版本均表現(xiàn)優(yōu)異,在多個基準(zhǔn)測試中擊敗了其他競爭對手,例如在Arena測試中得分超過1400分,在AIME考試中取得93%的成績。Grok 3-mini的性能雖然略遜于Grok 3,但也優(yōu)于其他主流模型。xAI還推出了DeepSearch,一種新型搜索引擎和Agent工具,能夠輔助編程和解答日常問題。
Grok 3的訂閱模式與未來規(guī)劃
Grok 3提供兩種訂閱模式:X平臺Premium+深度用戶和月費(fèi)30美元/年費(fèi)300美元的SuperGrok。xAI計(jì)劃在一周內(nèi)上線語音模式,數(shù)周后為企業(yè)用戶提供包含DeepSearch的API接入方案,并在幾個月后對Grok 2進(jìn)行開源。
Grok 3對Scaling Law的意義
Grok 3的發(fā)布被視為對Scaling Law的又一次驗(yàn)證,其強(qiáng)大的算力支持(20萬張英偉達(dá)GPU,4億個GPU小時)遠(yuǎn)超其他模型,這表明在LLM領(lǐng)域,Scaling Laws或許依然成立。Grok 3的成功也挑戰(zhàn)了“Scaling Law終結(jié)”的論調(diào)。
Grok 3的市場競爭力與爭議
雖然Grok 3在技術(shù)上表現(xiàn)出色,但在市場競爭力方面仍面臨挑戰(zhàn)。其市場份額遠(yuǎn)不及ChatGPT,并且曾因訪問X平臺數(shù)據(jù)而產(chǎn)生偏見爭議。一些觀點(diǎn)認(rèn)為,即使使用合成數(shù)據(jù),Grok 3也難以與參數(shù)規(guī)模更大的競爭對手匹敵。然而,Grok 3與X平臺的原生集成以及獨(dú)特的編程方式使其在X用戶中頗受歡迎。
Grok系列模型的演進(jìn)
Grok系列模型是xAI的核心產(chǎn)品,從Grok 1的合成數(shù)據(jù)訓(xùn)練,到Grok 2的合成數(shù)據(jù)與真實(shí)數(shù)據(jù)結(jié)合,再到Grok 3的強(qiáng)大算力支持和推理能力集成,體現(xiàn)了xAI在AI模型發(fā)展上的持續(xù)改進(jìn)和探索。
總而言之,Grok 3的發(fā)布是AI領(lǐng)域的一個重要,其強(qiáng)大的性能和獨(dú)特的特性使其成為一個值得關(guān)注的競爭者。然而,其能否最終躋身全球頂級模型之列,還需要時間的檢驗(yàn)。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。