o1慘敗得0分!
原標題:天才解法震驚人類!谷歌AI破天荒摘得奧數金牌,橫掃IMO 42道幾何難題
文章來源:新智元
內容字數:13926字
谷歌DeepMind AI攻克IMO幾何難題,AlphaGeometry 2奪金
谷歌DeepMind的AI系統AlphaGeometry 2 (AG2) 在國際數學奧林匹克競賽(IMO)幾何題上取得突破性進展,解題率高達84%,超越了歷年IMO金牌得主的平均水平,并成功了此前僅有計算性解法的2009年IMO最難幾何題。
1. AlphaGeometry 2的重大升級
AG2相較于前代AG1,進行了多項關鍵升級:首先,它采用了基于Gemini的更強大語言模型,并在更大、更多樣化的數據集上進行了訓練,顯著提升了理解和推理能力。其次,其符號引擎得到優化,速度提升了兩個數量級,并增強了處理重合點和線性方程的能力。此外,AG2還擴展了領域特定語言(DSL),覆蓋了88%的IMO幾何題目,并創新性地引入了基于知識共享集成的搜索樹(SKEST)算法,實現多個搜索樹并行運行并相互幫助,極大提升了搜索效率。
2. SKEST算法和自動圖形生成
SKEST算法是AG2的核心創新,它允許多個集束搜索并行運行并共享知識,顯著加速了搜索過程。AG2還能自動理解自然語言形式的幾何問題,并自動生成圖形,即使對于非構造性問題,也能通過兩階段數值優化方法找到解決方案。
3. 更強大、更快的符號引擎DDAR
AG2的核心是改進后的符號引擎DDAR,它在處理重合點、算法速度和實現效率上都有顯著提升。通過C++重新實現核心計算部分,速度比AG1快了300多倍。改進后的DDAR能更靈活地處理復雜幾何圖形,并以更接近人類思維的方式解決問題。
4. 更有效的合成訓練數據
AG2使用了更大、更多樣化、更復雜的合成訓練數據,這些數據嚴格從隨機圖開始生成,避免了數據污染,并探索了可能超出人類已知定理分布的定理。這使得模型能夠處理更復雜的問題,并具有更平衡的數據分布。
5. AlphaGeometry 2的創造性解法
AG2展現了超凡的創造力,它能夠通過構建關鍵的輔助作圖,僅依靠基本的角度關系推導和比例關系推導,解決此前只能用復雜計算方法才能解決的難題。這種解法甚至讓谷歌研究員感到震驚,被認為是AI在幾何證明領域的重大突破。
6. AlphaGeometry 2的局限性
盡管AG2取得了顯著進展,但它仍然存在一些局限性。目前它無法解決涉及不等式、可變數量的點以及一些高級幾何解法技巧(如反演、投影幾何或根軸)的問題。
7. 結論
AlphaGeometry 2的成功標志著人工智能在數學領域取得了新的里程碑。它不僅展現了AI強大的解題能力,更重要的是,它展現了AI在創造性思維方面的潛力,為未來AI在科學研究和工程領域的應用提供了新的可能性。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。