僅需格式轉換提升9%數學推理能力，上交開源新對齊方法ReAlign

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：僅需格式轉換提升9%數學推理能力，上交開源新對齊方法ReAlign
關鍵字：任務,模型,數據,事實性,騰訊
文章來源：量子位
內容字數：7148字

內容摘要：

Pengfei 投稿量子位 | 公眾號 QbitAI大模型對齊新方法，讓數學推理能力直接提升9%。
上海交通大學生成式人工智能實驗室（GAIR Lab）新成果ReAlign，現已開源。
隨著以ChatGPT為代表的語言大模型的快速發展，研究人員意識到訓練數據的質量才是大模型對齊的關鍵。
然而，目前主流的提示數據質量的方法不是需要大量人工成本（人工構造高質量數據）就是容易遭受大模型幻覺的影響（從蒸餾數據中選擇高質量樣本）。
ReAlign能以較小的人工成本提升現有數據集的質量，進而提升模型整體對齊能力，包含數學推理能力、回答問題的事實性、回答的可讀性。
目前，該項目開源了大量資源：
ReAlign代碼（使用方法和步驟均在Github中給出）
ReAlign后的數據集，Github倉庫中給出，同時包含huggingface版本。
46個不同任務場景對應的任務描述以及人工構造的回答格式。
用于對指令數據任務分類的分類器以及該分類器的訓練數據。
用于事實性（Factuality）評估的NQ數據集及其ground truth。
用于可讀性（Readability）和事實性（Factuality）

原文鏈接：僅需格式轉換提升9%數學推理能力，上交開源新對齊方法ReAlign