復旦大學：沒錢標數據的有福了！利用合成數據就能大幅提升大模型歸納推理能力

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：復旦大學：沒錢標數據的有福了！利用合成數據就能大幅提升大模型歸納推理能力
關鍵字：數據,歸納,代碼,模型,函數
文章來源：夕小瑤科技說
內容字數：0字

內容摘要：

夕小瑤科技說原創作者 | 謝年年推理，作為人類的基本認知過程，對于學習、問題解決和科學發現起著至關重要的作用。常見的推理方式包括演繹推理和歸納推理。
演繹推理就是從一般性的前提推導出個別或特殊情況的結論，而歸納推理則用于從具體實例中提煉出一般性的結論或規律。
研究學者一直試圖增強大模型的推理能力，但大部分訓練數據的指令都偏向演繹推理，比如“解釋一下這個代碼是什么意思”或者“寫一個程序找出列表中最大和最小的數”。
相比之下，那些要求從幾個例子中推斷出通用規則或函數關系的歸納推理任務，數據就稀缺多了。比如：“假設有:func(1) == 6 func(2) == 7 func(3) == 8 func(4) == 9給我解釋一下這個函數”或者“給定輸入與輸出john Smith -> Smith, John；frank lee -> Lee, Frank；Laura Jane Jones -> Jones,Laura，請編寫程序將輸入轉換為輸出”。
這種數據不平衡讓LLMs在歸納推理上學習困難，也缺乏有效評估其歸納能力的標準。為了填補這一空白，復旦大學發起了一項名為Case2Code的挑

原文鏈接：復旦大學：沒錢標數據的有福了！利用合成數據就能大幅提升大模型歸納推理能力