谷歌AI解決IMO中84%的幾何問題，o1一道沒做對！Nature：AI已超過金牌得主平均水平

2024年IMO第四題只用19秒

原標題：谷歌AI解決IMO中84%的幾何問題，o1一道沒做對！Nature：AI已超過金牌得主平均水平
文章來源：量子位
內容字數：3559字

谷歌DeepMind數學AI AlphaGeometry2：攻克IMO幾何難題

谷歌DeepMind最新研發的數學AI AlphaGeometry2在解決國際數學奧林匹克競賽（IMO）幾何問題上取得了突破性進展。該系統在2000-2024年IMO競賽的50道幾何題中成功解決了42道，準確率高達84%，相比前一代AlphaGeometry1提升了15道。這項成就甚至超越了純語言模型OpenAI o1和Gemini Flash Thinking，達到了與頂級人類選手相當的金牌水平。Nature雜志也對此進行了報道，稱DeepMind的AI粉碎了數學難題。

AlphaGeometry2的驚人速度和解題能力

AlphaGeometry2展現了令人驚嘆的速度和解題能力。例如，它僅用19秒就解決了2024年IMO競賽的第四題，該題要求證明兩個角度之和等于180°。AlphaGeometry2通過巧妙地構造輔助線，并利用相似三角形的性質完成了證明。更令人印象深刻的是，它還解決了此前僅有數值解的IMO Shortlist 2009的一道難題，并給出了優雅的幾何證明，所有輔助點的坐標都是神經網絡預測的。

AlphaGeometry2的四大核心升級

AlphaGeometry2的顯著進步源于四個方面的升級：

擴展版的領域專用語言： AlphaGeometry1的領域專用語言僅包含9個謂詞，AlphaGeometry2對其進行了擴展，覆蓋率從66%提升到88%，能夠處理線性方程、點/線/圓的移動以及角度計算等問題。
升級版的符號推理引擎DDAR2： DDAR2擁有更快的算法和更強大的功能，能夠處理坐標相同的不同名稱的點，時間復雜度從8次方降低到3次方，并通過C++實現代碼，速度提升了300倍。
全新的搜索算法SKEST： SKEST通過多個搜索樹并行運行和知識共享機制，更高效地尋找證明路徑。
更強大的語言模型： AlphaGeometry2采用最新的Gemini架構，并通過三種訓練方法進行訓練，實驗結果表明，代數推理是解決幾何問題的核心，而視覺信息并非關鍵因素。

AlphaGeometry2的未來與AIMO競賽

雖然AlphaGeometry2已經具備了獲得AIMO競賽金牌的能力，但目前并未開源。AIMO競賽為AI設立，首個獲得金牌的開源AI系統將獲得500萬美元的獎金，這為其他研究團隊提供了機會。2025年IMO競賽將于7月份在澳大利亞舉行，AlphaGeometry2的未來表現值得期待。

聯系作者

文章來源：量子位
作者微信：
作者簡介：追蹤人工智能新趨勢，關注科技行業新突破

閱讀原文

# AIGC動態 # AI幾何證明能力 # AI數學競賽 # AI超越人類專家 # 人工智能解題能力突破 # 大型語言模型數學應用

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

谷歌AI解決IMO中84%的幾何問題，o1一道沒做對！Nature：AI已超過金牌得主平均水平

2024年IMO第四題只用19秒

谷歌DeepMind數學AI AlphaGeometry2：攻克IMO幾何難題

AlphaGeometry2的驚人速度和解題能力

AlphaGeometry2的四大核心升級

AlphaGeometry2的未來與AIMO競賽

聯系作者

流量激增614%！Deepseek訪問量超越谷歌Gemini，AI市場正被重新定義？

為什么中國只有一個 DeepSeek？

相關文章

暫無評論

ChatGPT

玩虛擬模特？