AIGC動態歡迎閱讀
原標題:僅需格式轉換提升9%數學推理能力,上交開源新對齊方法ReAlign
關鍵字:任務,模型,數據,事實性,騰訊
文章來源:量子位
內容字數:7148字
內容摘要:
Pengfei 投稿量子位 | 公眾號 QbitAI大模型對齊新方法,讓數學推理能力直接提升9%。
上海交通大學生成式人工智能實驗室(GAIR Lab)新成果ReAlign,現已開源。
隨著以ChatGPT為代表的語言大模型的快速發展,研究人員意識到訓練數據的質量才是大模型對齊的關鍵。
然而,目前主流的提示數據質量的方法不是需要大量人工成本(人工構造高質量數據)就是容易遭受大模型幻覺的影響(從蒸餾數據中選擇高質量樣本)。
ReAlign能以較小的人工成本提升現有數據集的質量,進而提升模型整體對齊能力,包含數學推理能力、回答問題的事實性、回答的可讀性。
目前,該項目開源了大量資源:
ReAlign代碼(使用方法和步驟均在Github中給出)
ReAlign后的數據集,Github倉庫中給出,同時包含huggingface版本。
46個不同任務場景對應的任務描述以及人工構造的回答格式。
用于對指令數據任務分類的分類器以及該分類器的訓練數據。
用于事實性(Factuality)評估的NQ數據集及其ground truth。
用于可讀性(Readability)和事實性(Factuality)
原文鏈接:僅需格式轉換提升9%數學推理能力,上交開源新對齊方法ReAlign
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...