Grok 4

Grok 4 – 馬斯克旗下xAI推出的新一代大模型

Grok 4，由 xAI 推出的尖端人工智能模型，在推理能力上實現了質的飛躍，其表現是前代的十倍。它在 SAT、GRE 等高難度考試中接近滿分，并在多項基準測試中力壓群雄。Grok 4 具備多模態理解能力，能夠處理主觀概念、生成代碼和可視化內容，并在語音交互方面進行了顯著改進。

## Grok 4：人工智能領域的革新者

Grok 4 是 xAI 傾力打造的最新一代人工智能模型，標志著人工智能技術邁向新高度。它不僅在推理能力上實現了巨大突破，更在多模態理解、代碼生成和語音交互等方面帶來了創新。Grok 4 分為兩個版本：單代理的 Grok 4 和多代理的 Grok 4 Heavy，后者支持四個智能體協同工作，上下文窗口最高可達 256k tokens。

### Grok 4 的核心功能

* **卓越的推理能力：** 在 SAT、GRE 等高難度考試中展現出接近完美的表現，超越人類的推理水平。
* **多模態理解：** 能夠理解主觀概念，并進行圖像搜索和分析。
* **信息整合與摘要：** 從社交媒體等渠道提取關鍵信息，并按時間順序整理。
* **代碼與可視化生成：** 根據科學提示生成復雜動畫，如模擬黑洞碰撞。
* **語音交互增強：** 采用五種全新聲音，實現更流暢、更自然的對話體驗。
* **復雜任務處理：** 在模擬經營等復雜任務中表現出色，具備強大的戰略規劃和執行能力。
* **并行智能體協作：** SuperGrok Heavy 版本支持多個智能體并行解決復雜問題，提升效率。

### Grok 4 的測試表現

Grok 4 在多項測試中均展現出卓越的性能：

* **Humanity’s Last Exam：** Grok 4 Heavy 在使用工具的情況下得分達到 44.4%，進一步優化后可提升至 50.7%。
* **AIME25（數學競賽）：** Grok 4 Heavy 取得滿分，遙遙領先于其他模型。
* **GPQA（研究生水平問答）：** Grok 4 Heavy 得分 88.9%，超越 Gemini 2.5 Pro 和 Claude 4 Opus。
* **HMMT25（高中數學競賽）：** Grok 4 Heavy 得分 96.7%，遠超 Gemini 2.5 Pro。
* **USAMO25（美國數學奧賽）：** Grok 4 Heavy 得分 61.9%，顯著領先于 Gemini DeepThink 和 Gemini 2.5 Pro。
* **ARC-AGI（抽象推理）：** Grok 4 得分 15.9%，接近翻倍于之前的商業 SOTA。
* **Vending-Bench（模擬經營）：** Grok 4 凈賺 4694 美元，遠超 Claude Opus 4 和人類玩家。
* **第三方測評（Artificial Analysis）：**
* **人工智能指數：** Grok 4 獲得 73 分，超過其他競爭對手。
* **編碼指數和數學指數：** Grok 4 均排名第一。
* **GPQA Diamond 得分：** 創歷史新高，達到 88%。
* **Humanity’s Last Exam 得分：** 創歷史新高，達到 24%。
* **速度：** Grok 4 為 75 token/秒，表現出色。

### 產品定價

* **訂閱計劃：**
* SuperGrok：年費 300 美元，月費 30 美元。
* SuperGrok Heavy：年費 3000 美元，月費 300 美元。
* **API 調用：**
* 輸入：3 美元 / 百萬 token。
* 輸出：15 美元 / 百萬 token。

### 產品官網

官網地址：Grok

### 應用場景

* **教育輔導：** 為學生提供個性化學習方案，解答復雜學術問題。
* **科學研究：** 分析實驗數據，預測科學趨勢，輔助科學家探索新發現。
* **商業與金融：** 進行市場分析和預測，優化企業運營。
* **內容創作：** 輔助劇本撰寫、動畫制作，提升創作效率。
* **智能助手：** 幫助用戶完成日常任務，提升生活便利性。

### 常見問題

* **Grok 4 與前代產品的區別是什么？** Grok 4 在推理能力、多模態理解和語音交互方面都實現了顯著提升。
* **Grok 4 Heavy 有什么特別之處？** Grok 4 Heavy 具備多智能體并行協作能力，能更高效地解決復雜問題。
* **如何訂閱 Grok 4？** 用戶可以通過訪問 xAI 官網進行訂閱。
* **Grok 4 的 API 接口如何使用？** 官網提供了 API 調用的相關文檔和說明。

閱讀原文