原標題:突發,Grok-3免費上線!答對9.11和9.9誰大,1分攻克MIT積分難題
文章來源:新智元
內容字數:3099字
Grok-3:免費開放的強大AI,引發熱議與爭議
1. **Grok-3免費開放,引發開發者熱議:** xAI公司發布了其強大的AI模型Grok-3,并宣布免費開放給所有人使用,直到服務器崩潰為止。Grok-3擁有DeepSearch和Think兩種模式,號稱能夠快速解決復雜的難題,例如在MIT積分賽中僅用1分02秒就解決了問題,甚至能正確回答“9.11和9.9哪個大”這樣的問題(但并非所有情況下都能正確)。
2. **OpenAI質疑Grok-3作弊:** Grok-3的發布也引發了爭議。OpenAI的研究人員質疑Grok-3在評估中使用了基于64個樣本的多數投票方法來刷分,認為其夸大了模型的實際能力。雙方就此展開辯論,xAI否認作弊,并表示使用了與OpenAI相同的方法。
3. **Grok-3實際測試表現:** 實際測試顯示,Grok-3在不同模式下表現有所差異。在Think模式下,Grok-3能夠快速準確地回答“9.11和9.9哪個大”的問題;而在普通模式下,需要調整提問方式才能得到正確答案。Grok-3在代碼生成、上下文理解和遵循指令方面表現出色,能夠快速生成游戲、3D模型等,并展現出令人愉悅的性格。
4. **Grok-3的優勢與不足:** Grok-3的優點包括強大的代碼處理能力、超長的上下文窗口、優秀的指令遵循能力以及友好的用戶體驗。但同時也存在一些不足,例如在處理某些特定圖像生成任務時(例如倒立的人物)會出現錯誤。此外,其圖像生成能力令人驚嘆,能夠生成照片級真實的圖像,但也引發了人們對真假難辨的擔憂。
5. **高級語音模式即將推出:** xAI計劃為Grok-3推出高級語音模式,該模式將支持聯網、自定義語音、語音轉錄和音頻分享等功能,并提供男女兩種不同的語音選擇。
6. **總結:** Grok-3的出現標志著AI技術的一次顯著進步,其強大的功能和免費開放的策略使其備受關注。然而,圍繞其性能評估的爭議也提醒我們,對AI模型的評估需要更加嚴謹和客觀,避免夸大其能力或誤導公眾。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。