DeepMind祭出神經網絡與符號AI融合新招。
原標題:再創歷史!DeepMind AI超進化,能拿奧數金牌了
文章來源:智東西
內容字數:5422字
DeepMind AlphaGeometry2:幾何題解題能力超越IMO金牌得主
谷歌DeepMind近日發布了其升級版AI系統AlphaGeometry2,該系統在解決國際數學奧林匹克競賽(IMO)幾何問題上的表現超越了金牌得主的平均水平。這標志著AI在數學推理和邏輯證明能力上取得了顯著進展,也為通用人工智能(AGI)的研究提供了新的思路。
1. AlphaGeometry2的工作機制
AlphaGeometry2的核心在于融合了神經網絡和符號AI兩種方法。它利用谷歌Gemini系列語言模型(神經網絡架構)預測幾何題中需要添加的輔助線,再由符號引擎(基于規則的系統)根據這些輔助線進行邏輯推理和證明。 Gemini模型以形式化的數學語言為符號引擎提供建議,符號引擎則檢查這些步驟的邏輯性。系統還配備了并行搜索算法和公共知識庫,提高了效率和準確性。為了訓練模型,DeepMind還創建了一個包含超過3億個定理和證明的合成數據集。
2. AlphaGeometry2的優異表現
AlphaGeometry2在過去25年IMO的45道幾何題中成功解決了42道,得分超過了金牌得主的平均分。 雖然在另一組更難的題目中表現略遜,但其在大規模題集上的出色表現依然令人矚目。這使其成為第一個在如此大規模題集上達到IMO金牌水平的AI系統,并顯著優于OpenAI的o1推理模型。
3. 神經網絡與符號AI的融合
AlphaGeometry2的成功為神經網絡和符號AI之爭提供了新的視角。神經網絡派認為智能行為可通過大量數據和計算自發涌現,而符號AI派則強調規則和符號操作的重要性。AlphaGeometry2的混合方法證明了兩種方法的結合能有效提升AI的推理能力。雖然AlphaGeometry2的語言模型有時可以在沒有符號引擎輔助的情況下生成部分解決方案,但DeepMind團隊認為,在模型速度和可靠性進一步提升前,符號引擎等外部工具仍然至關重要。
4. 未來的挑戰與展望
盡管AlphaGeometry2取得了令人矚目的成就,但在處理一些簡單常識問題上,AI系統仍然存在不足。未來的研究需要關注如何提高AI系統在簡單任務上的準確性,拓展其處理復雜任務的能力,并降低開發和部署成本。 DeepMind的研究為AGI的探索提供了新的方向,但同時也提醒我們,AI技術仍有很大的發展空間,需要持續的研究和改進。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。