原標題:清華UCSD提出全新微調方法,8B小模型媲美GPT-4o!科學問題正確率提高28%
文章來源:新智元
內容字數:6020字
1. 引言
最近,來自加州大學圣地亞哥分校(UCSD)和清華大學的研究團隊提出了一種新的微調方法,使得一個僅有80億參數的小型模型在科學問題上能夠與GPT-4o相媲美。這一研究挑戰了AI開發中“更大模型必然更好”的傳統觀念,強調了模型在使用外部工具和依賴內部知識之間進行合理選擇的重要性。
2. 微調方法概述
該微調方法由兩部分組成:世界知識蒸餾(WKD)和工具使用適應(TUA)。在WKD中,模型通過學習使用工具生成的解答來積累特定領域的知識。TUA則幫助模型根據問題的復雜性判斷是否使用工具,提升了模型的效率和準確性。
3. 實驗與評估
研究團隊使用Llama-3.1-8B-Instruct作為基礎模型,評估了多種開源和閉源模型的表現。通過使用現有的MATH和SciBench數據集以及自定義的科學數據集(Mujoco、偏微分方程、氣候科學和流行病學),研究人員檢驗了微調方法的有效性。
4. 研究成果
結果顯示,微調后的模型在測試數據集上實現了28.18%的答案準確率提升和13.89%的工具使用精度提高。與未微調的基礎模型相比,微調方法在自定義數據集上表現顯著優于所有基準模型。
5. 結論
這一研究表明,教會AI在使用外部工具和依賴內部知識之間進行判斷,可能比單純增加計算能力更為重要。未來的AI研究應更注重模型的智能決策能力,以提高其在科學問題解決中的效率和準確性。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...