2024年IMO第四題只用19秒

原標題:谷歌AI解決IMO中84%的幾何問題,o1一道沒做對!Nature:AI已超過金牌得主平均水平
文章來源:量子位
內容字數:3559字
谷歌DeepMind數學AI AlphaGeometry2:攻克IMO幾何難題
谷歌DeepMind最新研發的數學AI AlphaGeometry2在解決國際數學奧林匹克競賽(IMO)幾何問題上取得了突破性進展。該系統在2000-2024年IMO競賽的50道幾何題中成功解決了42道,準確率高達84%,相比前一代AlphaGeometry1提升了15道。這項成就甚至超越了純語言模型OpenAI o1和Gemini Flash Thinking,達到了與頂級人類選手相當的金牌水平。Nature雜志也對此進行了報道,稱DeepMind的AI粉碎了數學難題。
AlphaGeometry2的驚人速度和解題能力
AlphaGeometry2展現了令人驚嘆的速度和解題能力。例如,它僅用19秒就解決了2024年IMO競賽的第四題,該題要求證明兩個角度之和等于180°。AlphaGeometry2通過巧妙地構造輔助線,并利用相似三角形的性質完成了證明。更令人印象深刻的是,它還解決了此前僅有數值解的IMO Shortlist 2009的一道難題,并給出了優雅的幾何證明,所有輔助點的坐標都是神經網絡預測的。
AlphaGeometry2的四大核心升級
AlphaGeometry2的顯著進步源于四個方面的升級:
- 擴展版的領域專用語言: AlphaGeometry1的領域專用語言僅包含9個謂詞,AlphaGeometry2對其進行了擴展,覆蓋率從66%提升到88%,能夠處理線性方程、點/線/圓的移動以及角度計算等問題。
- 升級版的符號推理引擎DDAR2: DDAR2擁有更快的算法和更強大的功能,能夠處理坐標相同的不同名稱的點,時間復雜度從8次方降低到3次方,并通過C++實現代碼,速度提升了300倍。
- 全新的搜索算法SKEST: SKEST通過多個搜索樹并行運行和知識共享機制,更高效地尋找證明路徑。
- 更強大的語言模型: AlphaGeometry2采用最新的Gemini架構,并通過三種訓練方法進行訓練,實驗結果表明,代數推理是解決幾何問題的核心,而視覺信息并非關鍵因素。
AlphaGeometry2的未來與AIMO競賽
雖然AlphaGeometry2已經具備了獲得AIMO競賽金牌的能力,但目前并未開源。AIMO競賽為AI設立,首個獲得金牌的開源AI系統將獲得500萬美元的獎金,這為其他研究團隊提供了機會。2025年IMO競賽將于7月份在澳大利亞舉行,AlphaGeometry2的未來表現值得期待。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號