今日arXiv最熱大模型論文:COLING 2024: 復(fù)旦發(fā)布AoR,層級聚合推理突破大模型復(fù)雜推理上限
AIGC動態(tài)歡迎閱讀
原標(biāo)題:今日arXiv最熱大模型論文:COLING 2024: 復(fù)旦發(fā)布AoR,層級聚合推理突破大模型復(fù)雜推理上限
關(guān)鍵字:答案,模型,任務(wù),分?jǐn)?shù),性能
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | Axe_越“三個臭皮匠,頂個諸葛亮?”
“一個模型不行,那就再堆一個?”
過去當(dāng)我們在處理復(fù)雜任務(wù)的時候,往往會考慮集成策略(Ensembling Strategy),通過多個模型投票的方式,選出更可能正確的答案。然而在更復(fù)雜的情況下,“真理往往掌握在少數(shù)人手中”,這時采取多數(shù)投票,就會使得結(jié)論偏離正確答案更遠(yuǎn)。
因此,與其單純評估答案是否正確來進(jìn)行投票,不如反推思考過程,就好比在考試的時候,寫出正確的應(yīng)用題解題步驟至少就能得到大半的分。如果能對模型的中間推理步驟也做進(jìn)一步剖析,將有助于得到更可靠的結(jié)果。
論文標(biāo)題:Aggregation of Reasoning: A Hierarchical Framework for Enhancing Answer Selection in Large Language Models
論文鏈接:https://arxiv.org/pdf/2405.12939.pdf
思維鏈思維鏈(Chain-of-Thought,CoT)技術(shù)是一種在大模型(LLMs)中引入的技術(shù),旨在通過生成一系列中間步驟來解決復(fù)雜的推理任務(wù)。這種
原文鏈接:今日arXiv最熱大模型論文:COLING 2024: 復(fù)旦發(fā)布AoR,層級聚合推理突破大模型復(fù)雜推理上限
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業(yè)、有趣、深度價值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189