天才解法震驚人類！谷歌AI破天荒摘得奧數金牌，橫掃IMO 42道幾何難題

o1慘敗得0分！

原標題：天才解法震驚人類！谷歌AI破天荒摘得奧數金牌，橫掃IMO 42道幾何難題
文章來源：新智元
內容字數：13926字

谷歌DeepMind AI攻克IMO幾何難題，AlphaGeometry 2奪金

谷歌DeepMind的AI系統AlphaGeometry 2 (AG2) 在國際數學奧林匹克競賽(IMO)幾何題上取得突破性進展，解題率高達84%，超越了歷年IMO金牌得主的平均水平，并成功了此前僅有計算性解法的2009年IMO最難幾何題。

1. AlphaGeometry 2的重大升級

AG2相較于前代AG1，進行了多項關鍵升級：首先，它采用了基于Gemini的更強大語言模型，并在更大、更多樣化的數據集上進行了訓練，顯著提升了理解和推理能力。其次，其符號引擎得到優化，速度提升了兩個數量級，并增強了處理重合點和線性方程的能力。此外，AG2還擴展了領域特定語言(DSL)，覆蓋了88%的IMO幾何題目，并創新性地引入了基于知識共享集成的搜索樹(SKEST)算法，實現多個搜索樹并行運行并相互幫助，極大提升了搜索效率。

2. SKEST算法和自動圖形生成

SKEST算法是AG2的核心創新，它允許多個集束搜索并行運行并共享知識，顯著加速了搜索過程。AG2還能自動理解自然語言形式的幾何問題，并自動生成圖形，即使對于非構造性問題，也能通過兩階段數值優化方法找到解決方案。

3. 更強大、更快的符號引擎DDAR

AG2的核心是改進后的符號引擎DDAR，它在處理重合點、算法速度和實現效率上都有顯著提升。通過C++重新實現核心計算部分，速度比AG1快了300多倍。改進后的DDAR能更靈活地處理復雜幾何圖形，并以更接近人類思維的方式解決問題。

4. 更有效的合成訓練數據

AG2使用了更大、更多樣化、更復雜的合成訓練數據，這些數據嚴格從隨機圖開始生成，避免了數據污染，并探索了可能超出人類已知定理分布的定理。這使得模型能夠處理更復雜的問題，并具有更平衡的數據分布。

5. AlphaGeometry 2的創造性解法

AG2展現了超凡的創造力，它能夠通過構建關鍵的輔助作圖，僅依靠基本的角度關系推導和比例關系推導，解決此前只能用復雜計算方法才能解決的難題。這種解法甚至讓谷歌研究員感到震驚，被認為是AI在幾何證明領域的重大突破。

6. AlphaGeometry 2的局限性

盡管AG2取得了顯著進展，但它仍然存在一些局限性。目前它無法解決涉及不等式、可變數量的點以及一些高級幾何解法技巧（如反演、投影幾何或根軸）的問題。

7. 結論

AlphaGeometry 2的成功標志著人工智能在數學領域取得了新的里程碑。它不僅展現了AI強大的解題能力，更重要的是，它展現了AI在創造性思維方面的潛力，為未來AI在科學研究和工程領域的應用提供了新的可能性。

聯系作者

文章來源：新智元
作者微信：
作者簡介：智能+中國主平臺，致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展，關注人機融合、人工智能和機器人對人類社會與文明進化的影響，領航中國新智能時代。

閱讀原文

# AIGC動態 # AI幾何題求解 # AI奧數競賽 # IMO人工智能解題 # 人工智能數學突破 # 谷歌AI數學能力

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

天才解法震驚人類！谷歌AI破天荒摘得奧數金牌，橫掃IMO 42道幾何難題

o1慘敗得0分！

谷歌DeepMind AI攻克IMO幾何難題，AlphaGeometry 2奪金

1. AlphaGeometry 2的重大升級

2. SKEST算法和自動圖形生成

3. 更強大、更快的符號引擎DDAR

4. 更有效的合成訓練數據

5. AlphaGeometry 2的創造性解法

6. AlphaGeometry 2的局限性

7. 結論

聯系作者

房價預測/礦藏勘探/自然災害預測……AI助力地球科學革新，浙大/清華/Google Research等已發表重要成果

體驗蘋果新應用兩天后，我開始期待微信「抄作業」

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點