MathGLM官網
智譜AI推數學模型MathGLM 部分表現超GPT4。它可以在不使用計算器工具的情況下,執行復雜算術運算,解答中文數學應用題,部分表現超過GPT4和ChatGPT。
網站服務:AI大模型平臺,AI大模型,mathglm,數學大模型,解決數學問題,modelscope,魔搭社區,模型,AI大模型平臺,mathglm。
MathGLM簡介
匯聚各領域最先進的機器學習模型,提供模型探索體驗、推理、訓練、部署和應用的一站式服務。
MathGLM 包含 10M、100M、500M、2B 等多個參數版本,具備處理最多 12 位數字的運算能力。而且有測評結果顯示,通過充分的數據訓練,MathGLM-2B 可以準確執行多位數的算術運算,準確率高達 93.03%(接近 100%),顯著超越 GPT-4 在相同測試數據上 18.84% 的準確率。10 億參數版本的 MathGLM-10B 則在 5000 條中文數學應用題的測試數據集上實現了接近 GPT-4 的性能。
MathGLM 出色的表現,離不開其在模型架構、數據集等方面的一系列創新。
針對算術任務,研發團隊采用 Transformer 的 decoder 架構,并使用自回歸目標在生成的算術數據集上從頭訓練。算術訓練數據集包含各類算術任務、各種運算符(含加法、減法、乘法、除法和求冪)、多種數字格式(含整數、小數、百分比、分數和負數)。研發團隊還采用分步計算策略對該數據集進行了重構,并且讓單個算術表達式由 2 到 10 個運算步驟組成,以方便 MathGLM 對每個中間結果進行準確計算,從而得到每個算術表達式的正確答案。
評測結果顯示,MathGLM 在一個包含 9592 條測試用例、專門為算術任務量身定制的數據集上的表現,顯著優于 GPT4 和 ChatGPT。
針對更復雜的數學問題——中文應用題,研發團隊微調了一系列以 GLM 為基座模型、用于解決數學應用題的 MathGLM。
訓練過程中使用了一個包含 21 萬道中文小學數學題的高質量數據集 Ape210K,但其不足之處在于每個題的答案都是直接計算得出,缺乏相應的計算過程。因此,研發團隊采用分步策略對 Ape210K 數據集進行了重構,方便 MathGLM 深入理解和學習潛在的計算邏輯和規則,逐步計算出每個數學問題的答案,提升最終答案的準確性。
此外,研發團隊還使用 ChatGLM-6B 和 ChatGLM2-6B 作為基座模型來訓練 MathGLM,賦予 MathGLM 基本的語言理解能力,使其能夠有效理解數學應用題中包含的語言信息。
在 Ape210K 數據集上進行測試的結果顯示,MathGLM 模型在答案準確性方面已接近 GPT-4。在一個包含 1-6 年級數學應用題的數據集 K6 上進行評測的結果顯示,MathGLM 相比于其他中文模型(GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B 等),呈現出了更強的數學推理能力。
為方便開發者快速上手體驗 MathGLM,魔搭社區第一時間推出了模型體驗、推理實踐教程。
MathGLM官網入口網址
OpenI小編發現MathGLM網站非常受用戶歡迎,請訪問MathGLM網址入口試用。
數據評估
本站OpenI提供的MathGLM都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 11月 8日 下午12:58收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。