剛剛，谷歌發布71頁AI科研報告！6大領域全面超越專家，幾小時頂幾個月

導讀：谷歌的AI系統在處理高難度數學積分和時間序列預測方面展現出驚人能力，不僅解決了傳統方法難以企及的問題，還從零開始構建了通用的預測模型。更重要的是，AI在基因組學、神經科學等前沿領域展現出創新和跨界能力，預示著科研范式的深刻變革。AI正成為高效的實驗員和方法發明者，而人類科學家則將扮演更高維度的決策者角色。

數學難題的AI之道

在算法能力面臨極限挑戰的數學領域，谷歌的AI系統以其卓越的表現令人矚目。面對19個異常復雜的積分任務，傳統的數值計算方法幾乎全軍覆沒，而AI系統卻成功攻克了其中的17個。這一成就并非簡單的表面計算，而是AI深入理解復雜數學場景并尋找到突破口能力的體現。

正如數值積分任務的示例所示，AI系統在19個測試積分中成功求解了17個，而標準數值方法卻束手無策。對于科研人員而言，這意味著在長期困擾的數值計算難題上，AI已能提供切實可行的解決方案。

時間序列預測的通用化突破

在通用時間序列預測的GIFT-Eval基準測試中，谷歌的AI系統完成了一項近乎不可能的任務。該系統從零開始，僅憑一段代碼通過不斷優化，成功構建了一個覆蓋28個數據集、橫跨7個領域、適配從秒到年10種頻率的通用預測庫。這不僅證明了AI解決具體問題的能力，更彰顯了其總結通用方法、實現跨領域泛化的強大潛力。

科研范式的革新：AI的創新與跨界能力

前述案例僅僅是AI在科研領域卓越表現的冰山一角。其背后更令人振奮的是，AI已不再滿足于模仿，而是開始在科研中展現出真正的創新能力和跨學科的通用性。在基因組學研究中，AI能夠自主地融合兩種不同的專家方法，生成比人類更優越的解決方案。而在神經科學領域，AI更是首次實現了生物物理模擬器與深度模型的結合，開辟了一種全新的混合研究思路。

盡管學界和業界已有DeepResearchGym等評測框架和OpenProblems.bio等公開基準，但谷歌的系統首次在這些基準上實現了端到端的流程貫通，并產出了可量化、可復現的專家級成果。這種創新并非孤立的亮點，而是跨學科的普遍趨勢。從基因組學到公共健康，從遙感影像到時間序列預測，該系統都能快速適應并探索新的研究路徑。這些多樣的基準測試，全面評估了AI在零樣本泛化、高維信號處理、不確定性量化、復雜數據語釋以及系統層面建模等方面的能力。

過去，科學家們依靠反復試驗來推動科學進步，如今AI系統能夠以相同的方式進行大規模試錯，且速度提升了數百倍，將數月的探索時間壓縮至數小時。這預示著科研的節奏將迎來真正的“指數級加速”。

AI賦能實驗室：人類科學家的新定位

隨著AI在多個前沿領域展現出生成新方法、驗證結果甚至超越專家的能力，人類科學家的角色正在經歷深刻的重塑。在這套AI系統中，AI承擔了不知疲倦的實驗與探索工作，能夠嘗試、優化和篩選成千上萬種方案，將原本需要數月甚至更長時間的工作壓縮到幾小時或幾天內。AI系統能夠快速生成專家級的解決方案，將一組想法的探索時間從數月縮短到數小時或數天。

而人類科學家的職責則逐漸轉向提出研究方向、判斷研究價值以及設定優先級。AI可以在技術路徑上無限拓展，但科研問題的意義和其背后的社會價值，依然需要人類來確立和把握。這標志著科研分工正走向一種新的格局：AI可能成為高效的實驗員和方法發明者，而人類則將站在更高的維度上進行選擇和決策。

谷歌的這套系統已不再僅僅是一個“研究工具”的實驗，而是朝著與FunSearch、AI co-scientist等項目相同的方向邁進——從單點突破走向跨領域的科研合作者。值得一提的是，谷歌已將該系統產出的最佳方案全部開源，并提供交互界面，允許研究人員追蹤整個搜索與突破過程。這種開放的態度，將使科研界能夠直接在真實任務中驗證和拓展AI生成的研究解決方案。

閱讀原文