MiniRAG – 港大推出高效部署小語言模型的新型 RAG 系統
MiniRAG是什么
MiniRAG是由香港大學開發的一種創新型檢索增強生成(RAG)系統,旨在資源受限的環境中高效部署小型語言模型(SLMs)。該系統的設計基于兩項核心技術:首先是語義感知的異構圖索引機制,通過結合文本片段和命名實體,降低對復雜語義理解的依賴;其次是輕量級拓撲增強檢索方法,利用圖結構進行高效的知識發現,避免對高級語言能力的需求。MiniRAG在實驗中展示了與大型語言模型(LLMs)相當的性能,同時僅需25%的存儲空間。它提供了全面的基準數據集,以評估輕量級RAG系統在實際設備環境下的表現,推動在資源受限的環境中高效且私密的RAG系統的發展。
MiniRAG的主要功能
- 高效的知識檢索:憑借獨特的異構圖索引機制,MiniRAG能夠快速準確地從海量數據中提取與用戶查詢最相關的知識,從而為生成精準的回答提供支持。
- 輕量級的模型兼容性:該系統專為小型語言模型(SLMs)設計,在不顯著降低性能的前提下,顯著減少對計算資源和存儲空間的需求,使其更適合在資源有限的設備上運行。
- 強大的推理能力:通過查詢引導的推理路徑發現機制,MiniRAG能夠處理復雜的多步驟推理任務,即使在SLMs的語義理解能力有限的情況下,也能有效找到正確答案。
- 適應性強:MiniRAG能夠適應多種應用場景,包括即時通訊、個人內容管理和本地文檔檢索,為用戶提供個性化的信息檢索和生成服務。
MiniRAG的技術原理
- 語義感知的異構圖索引機制:
- 文本塊節點(Vc):保持原始文本的上下文完整性,直接參與檢索階段,確保能夠識別出最相關的上下文內容。
- 實體節點(Ve):提取自文本塊的關鍵語義元素,如、地點、時間引用和領域特定概念,用于錨定語義理解。
- 實體-實體連接(Eα):捕捉命名實體之間的語義關系、層次結構及時空依賴關系。
- 實體-文本塊連接(Eβ):連接命名實體及其對應的上下文,保持上下文的相關性和語義的連貫性。
- 邊的語義描述:為連接的節點提供明確的關系上下文,增強圖的語義理解能力,這些描述由語言模型生成。
- 輕量級拓撲增強檢索方法:
- 查詢語義映射:利用實體提取和輕量級句子嵌入模型,將用戶的查詢與圖索引數據對齊,以識別相關文本塊。
- 查詢驅動的推理路徑發現:在異構圖中基于智能查詢引導機制構建推理路徑,綜合考慮查詢與實體節點之間的語義相關性及實體之間的結構連貫性。
- 拓撲增強的圖檢索:結合基于嵌入的相似性搜索和圖結構的拓撲信息,識別與查詢相關的高質量實體-實體連接,并提取邏輯相關的推理鏈。
- 查詢相關文本塊的檢索:基于實體-文本塊連接,收集與推理路徑相關的文本塊,計算輸入查詢與文本塊及其邊描述的語義相似性,從而選擇最相關的文本塊用于后續生成任務。
- 融合增強生成:將檢索到的關鍵關系和最優文本塊與先前確定的答案節點結合,構建全面且結構化的輸入表示,以用于最終的增強生成過程。
MiniRAG的項目地址
- GitHub倉庫:https://github.com/HKUDS/MiniRAG/
- arXiv技術論文:https://arxiv.org/pdf/2501.06713
MiniRAG的應用場景
- 即時通訊:快速檢索歷史記錄,生成智能回復,并提供知識輔助。
- 個人內容管理:檢索個人筆記,生成內容總結和提醒,幫助管理日程。
- 本地文檔檢索:檢索本地文檔內容,整合多文檔信息,生成智能摘要。
- 隱私敏感應用:安全管理醫療和金融信息,提供保護隱私的問答服務。
- 邊緣設備應用:在智能手表、智能音箱等設備上提供快速響應和智能服務。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...