DeepRAG – 中科院、中科大和騰訊微信AI部聯(lián)合推出的新型檢索增強(qiáng)生成框架
DeepRAG是什么
DeepRAG是由中國科學(xué)院、中國科學(xué)技術(shù)大學(xué)及騰訊微信AI部合作開發(fā)的一種全新檢索增強(qiáng)生成(RAG)框架,旨在提升大型語言模型(LLMs)在推理和檢索任務(wù)上的表現(xiàn)。該框架通過將檢索增強(qiáng)推理視為馬爾可夫決策過程(MDP),引入“檢索敘事”和“原子決策”兩個(gè)關(guān)鍵元素,從而實(shí)現(xiàn)了結(jié)構(gòu)化且自適應(yīng)的檢索流程。DeepRAG的核心在于動態(tài)決策:模型在每個(gè)步驟會根據(jù)當(dāng)前狀態(tài)判斷是否需要檢索外部知識,或僅依賴其內(nèi)部參數(shù)進(jìn)行推理。
DeepRAG的主要功能
- 動態(tài)檢索決策:DeepRAG能夠在每一步動態(tài)決定是否檢索外部知識,或僅使用模型本身的知識進(jìn)行推理,避免了不必要的檢索操作,從而提高了檢索效率,減少了噪聲和推理延遲。
- 結(jié)構(gòu)化檢索流程:通過引入“檢索敘事”,DeepRAG確保檢索過程是有序且適應(yīng)性的。模型根據(jù)先前檢索到的信息生成新的子查詢,逐步推進(jìn)推理過程,更有效地處理復(fù)雜的查詢。
- 知識邊界校準(zhǔn):DeepRAG應(yīng)用“校準(zhǔn)鏈”方法,幫助模型更精準(zhǔn)地識別自身知識的界限。模型能夠更好地判斷何時(shí)需要檢索外部信息,何時(shí)可以依靠自己的知識進(jìn)行推理,從而提升答案的準(zhǔn)確性和可靠性。
- 提升檢索效率和答案準(zhǔn)確性:實(shí)驗(yàn)結(jié)果顯示,DeepRAG在多個(gè)開放域問答數(shù)據(jù)集上顯著提高了答案的準(zhǔn)確性(平均提升21.99%),同時(shí)減少了檢索次數(shù),優(yōu)化了整體檢索效率。
- 泛化能力與魯棒性:DeepRAG在時(shí)間敏感及分布外的問答任務(wù)中展現(xiàn)出優(yōu)異的泛化能力和魯棒性,能夠適應(yīng)不同的問答場景及數(shù)據(jù)分布。
DeepRAG的技術(shù)原理
- 馬爾可夫決策過程(MDP)建模:DeepRAG將檢索增強(qiáng)推理過程建模為MDP,表示原始問題的部分解決方案。狀態(tài)st包含輸入問題x及當(dāng)前的子查詢和中間答案,決策分為兩個(gè)子項(xiàng):
- 終止決策(Termination Decision):決定是否生成下一個(gè)子查詢,或直接輸出最終答案。
- 原子決策(Atomic Decision):決定是否進(jìn)行外部檢索,或僅依賴模型的內(nèi)部知識。
- 狀態(tài)轉(zhuǎn)移(Transitions):根據(jù)所做的決策更新狀態(tài)。如果選擇檢索,模型會獲取相關(guān)文檔并生成中間答案;如果選擇不檢索,則直接生成中間答案。
- 獎勵機(jī)制(Rewards):根據(jù)答案的正確性和檢索成本評估狀態(tài)。獎勵函數(shù)旨在最大化答案的準(zhǔn)確性,同時(shí)最小化檢索成本。
- 二叉樹搜索(Binary Tree Search):DeepRAG采用二叉樹搜索策略為每個(gè)子查詢構(gòu)建推理路徑。在每個(gè)子查詢中,模型生成兩個(gè)分支:一個(gè)基于參數(shù)知識直接生成答案,另一個(gè)通過檢索外部知識生成答案。這種方式允許模型探索不同的檢索策略,構(gòu)建從問題到最終答案的完整推理路徑。二叉樹搜索能夠分解問題,全面分析檢索選擇對最終答案的影響。
- 模仿學(xué)習(xí)(Imitation Learning):模仿學(xué)習(xí)旨在讓模型掌握有效的檢索模式。通過優(yōu)先隊(duì)列高效探索潛在的推理軌跡,優(yōu)先選擇檢索成本較低的路徑。結(jié)合二叉樹搜索合成的數(shù)據(jù),提取出達(dá)成正確最終答案的推理過程。利用這些合成數(shù)據(jù)對模型進(jìn)行微調(diào),提高其終止決策和原子決策的能力,同時(shí)增強(qiáng)查詢分解和可靠中間答案生成的能力。
- 校準(zhǔn)鏈(Chain of Calibration):校準(zhǔn)鏈方法進(jìn)一步優(yōu)化模型對自身知識邊界的認(rèn)識。通過合成偏好數(shù)據(jù)確定何時(shí)需要檢索,基于最優(yōu)路徑生成,指示每個(gè)子查詢的首選檢索策略。利用這些偏好數(shù)據(jù)對模型進(jìn)行微調(diào),增強(qiáng)其基于內(nèi)部知識邊界的原子決策能力。通過校準(zhǔn)鏈,模型能更準(zhǔn)確地判斷何時(shí)需要外部知識,從而依賴自身知識進(jìn)行推理。
DeepRAG的項(xiàng)目地址
- arXiv技術(shù)論文:https://arxiv.org/pdf/2502.01142
DeepRAG的應(yīng)用場景
- 開放域問答:DeepRAG能夠處理復(fù)雜的多跳問答任務(wù),通過逐步分解問題并動態(tài)檢索相關(guān)信息,生成準(zhǔn)確的答案。
- 知識庫問答:在知識庫問答場景中,DeepRAG可以結(jié)合外部知識庫(如)和模型自身的知識,提供更精確的答案。
- 智能客服與虛擬助手:DeepRAG可應(yīng)用于智能客服系統(tǒng),通過動態(tài)檢索和推理,提供更準(zhǔn)確且及時(shí)的客戶支持。
- 教育與學(xué)習(xí)輔助:在教育領(lǐng)域,DeepRAG能夠幫助學(xué)生和教師獲取更準(zhǔn)確的知識和信息,依據(jù)學(xué)生的學(xué)習(xí)進(jìn)度和需求,動態(tài)生成學(xué)習(xí)材料和練習(xí)題。
- 醫(yī)療健康咨詢:DeepRAG可以用于醫(yī)療健康咨詢,通過檢索最新的醫(yī)學(xué)研究和臨床指南,提供精準(zhǔn)的健康建議。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...