AIGC動態歡迎閱讀
原標題:以圖靈機為師:通過微調訓練讓大語言模型懂執行計算過程
關鍵字:算術,圖靈機,累加器,加法,模型
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
本文來自學計算機學院軟件研究所,聚焦于開放環境下的智能軟件新技術研究,定位國際學術前沿,面向國家關鍵需求,承擔了一系列國家科技部和基金委重大/重點科研項目。團隊擁有包括中科院院士等多名國家級人才,重點關注軟件和智能方向,研究成果發表于NeurIPS/ICLR/SOSP/ATC/EuroSys/OOPSLA/PLDI/ICSE/FSE等國際頂級會議,其中多篇文章獲得相應會議的最佳論文獎。
大型語言模型 (LLM) 在各種自然語言處理和推理任務中表現出卓越的能力,某些應用場景甚至超越了人類的表現。然而,這類模型在最基礎的算術問題的表現上卻不盡如人意。當遇到算術問題時,LLM 通常依賴記住特定的表達式及其對應結果的方式輸出算術問題的結果。通過簡單的實驗發現,
原文鏈接:以圖靈機為師:通過微調訓練讓大語言模型懂執行計算過程
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...