AIGC動態歡迎閱讀
原標題:復旦大學:沒錢標數據的有福了!利用合成數據就能大幅提升大模型歸納推理能力
關鍵字:數據,歸納,代碼,模型,函數
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | 謝年年推理,作為人類的基本認知過程,對于學習、問題解決和科學發現起著至關重要的作用。常見的推理方式包括演繹推理和歸納推理。
演繹推理就是從一般性的前提推導出個別或特殊情況的結論,而歸納推理則用于從具體實例中提煉出一般性的結論或規律。
研究學者一直試圖增強大模型的推理能力,但大部分訓練數據的指令都偏向演繹推理,比如“解釋一下這個代碼是什么意思”或者“寫一個程序找出列表中最大和最小的數”。
相比之下,那些要求從幾個例子中推斷出通用規則或函數關系的歸納推理任務,數據就稀缺多了。比如:“假設有:func(1) == 6 func(2) == 7 func(3) == 8 func(4) == 9給我解釋一下這個函數”或者“給定輸入與輸出john Smith -> Smith, John;frank lee -> Lee, Frank;Laura Jane Jones -> Jones,Laura,請編寫程序將輸入轉換為輸出”。
這種數據不平衡讓LLMs在歸納推理上學習困難,也缺乏有效評估其歸納能力的標準。為了填補這一空白,復旦大學發起了一項名為Case2Code的挑
原文鏈接:復旦大學:沒錢標數據的有福了!利用合成數據就能大幅提升大模型歸納推理能力
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...