AIGC動態歡迎閱讀
原標題:微軟發布Orca2,“式”教會小規模大語言模型如何推理!
文章來源:夕小瑤科技說
內容字數:7713字
內容摘要:夕小瑤科技說 原創作者 | 付奶茶我們都知道在大多數情況下,語言模型的體量和其推理能力之間存在著正相關的關系:模型越大,其處理復雜任務的能力往往越強。然而,這并不意味著小型模型就永遠無法展現出色的推理性能。最近,奶茶發現了微軟的Orca2公開了論文,它詳細探討了如何提升小型大語言模型的推理能力,這樣的研究無疑是在資源有限或對模型大小有特定要求的場景的重大進步。接下來,讓我們一起來了解這篇論文的詳細工作吧!論文題目:Orca 2: Teaching Small Language Models How to Reason論文鏈接: https://arxiv.org/pdf/2311.11045.pdf在研究團隊之前發布的Orca1中,通過使用解釋跟蹤這類更豐富的信號訓練模型,已經超過了傳統指令調優模型在BigBench Hard和AGIEval基準測試中的表現。在Orca2中,研究團隊繼續探…
原文鏈接:點此閱讀原文:微軟發布Orca2,“式”教會小規模大語言模型如何推理!
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI應用開發者、算法工程師和研究人員。一線作者均來自清北、國外頂級AI實驗室和互聯網大廠,兼備媒體sense與技術深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...