今日arXiv最熱NLP大模型論文：上海AI Lab聯合清華發布十項全能數學大模型InternLM-Math

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：今日arXiv最熱NLP大模型論文：上海AI Lab聯合清華發布十項全能數學大模型InternLM-Math
關鍵字：模型,數學,數據,能力,鏈式
文章來源：夕小瑤科技說
內容字數：8686字

內容摘要：

夕小瑤科技說原創作者 | 芒果、Python引言：數學推理與大語言模型的新突破數學推理能力是大語言模型（LLMs）抽象推理能力的一個重要體現。近年來，隨著深度學習技術的不斷進步，LLMs在數學推理任務上取得了顯著的進展。從小學級別到高中級別的數學問題，通過鏈式推理（chain-of-thought reasoning）或程序式推理（program-of-thought reasoning），LLMs展現出了解決數學問題的潛力。這些模型的構建需要在數學語料上進行預訓練，并在數學問題上進行監督式微調。在這一背景下，該研究介紹了InternLM-Math，基于InternLM2-Base模型繼續預訓練的數學推理LLM。InternLM-Math不僅在解決數學問題方面表現出色，還在驗證、證明和數據增強等多個方面展現了其能力。本文將對InternLM-Math的最新進展進行介紹，包括其在各項基準測試中的表現，以及如何通過開源的方式推動數學LLMs的發展。
論文標題：InternLM-Math: Open Math Large Language Models Toward Verifiable

原文鏈接：今日arXiv最熱NLP大模型論文：上海AI Lab聯合清華發布十項全能數學大模型InternLM-Math