AIGC動態歡迎閱讀
原標題:今日arXiv最熱大模型論文:COLING 2024: 復旦發布AoR,層級聚合推理突破大模型復雜推理上限
關鍵字:答案,模型,任務,分數,性能
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | Axe_越“三個臭皮匠,頂個諸葛亮?”
“一個模型不行,那就再堆一個?”
過去當我們在處理復雜任務的時候,往往會考慮集成策略(Ensembling Strategy),通過多個模型投票的方式,選出更可能正確的答案。然而在更復雜的情況下,“真理往往掌握在少數人手中”,這時采取多數投票,就會使得結論偏離正確答案更遠。
因此,與其單純評估答案是否正確來進行投票,不如反推思考過程,就好比在考試的時候,寫出正確的應用題解題步驟至少就能得到大半的分。如果能對模型的中間推理步驟也做進一步剖析,將有助于得到更可靠的結果。
論文標題:Aggregation of Reasoning: A Hierarchical Framework for Enhancing Answer Selection in Large Language Models
論文鏈接:https://arxiv.org/pdf/2405.12939.pdf
思維鏈思維鏈(Chain-of-Thought,CoT)技術是一種在大模型(LLMs)中引入的技術,旨在通過生成一系列中間步驟來解決復雜的推理任務。這種
原文鏈接:今日arXiv最熱大模型論文:COLING 2024: 復旦發布AoR,層級聚合推理突破大模型復雜推理上限
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189