HippoRAG 2

HippoRAG 2 – 俄亥俄州立大學推出的檢索增強生成框架

HippoRAG 2是由俄亥俄州立大學開發的一種檢索增強生成（RAG）框架，旨在克服傳統RAG系統在模擬人類長期記憶的動態性和關聯性方面的不足。通過個性化PageRank算法，HippoRAG 2實現了深度段落整合和更高效的在線大型語言模型（LLM）應用，使其在知識檢索和生成過程中更接近人類的記憶效果。

HippoRAG 2是什么

HippoRAG 2是俄亥俄州立大學推出的一種創新型檢索增強生成（RAG）框架，專注于解決現有系統在模擬人類長期記憶方面的局限性。該框架利用個性化PageRank算法，結合深度段落整合及高效的在線大型語言模型（LLM），推動RAG系統更好地模擬人類思維。HippoRAG 2在離線階段使用LLM從段落中提取三元組，并構建開放知識圖譜（KG），同時通過嵌入模型識別同義詞以豐富知識圖譜。在在線檢索時，系統將查詢與KG中的三元組和段落進行關聯，利用LLM過濾無關信息，應用個性化PageRank算法實現上下文感知的檢索，從而為問答任務提供最相關的段落。

HippoRAG 2

HippoRAG 2的主要功能

高效的知識檢索與整合：通過深度段落整合與知識圖譜（KG）的構建，快速檢索并整合與查詢相關的知識。
多跳關聯推理：利用個性化PageRank算法，系統能夠進行多跳推理，連接分散的知識片段，從而應對復雜的問答任務。
上下文感知檢索：結合查詢與知識圖譜的互動，動態調整檢索結果，提升準確性和相關性。
持續學習能力：HippoRAG 2作為一種非參數化的持續學習框架，能夠實時吸收新知識，提升系統的適應性，而無需修改模型參數。

HippoRAG 2的技術原理

離線索引（Offline Indexing）：利用LLM從文本段落中提取結構化三元組（主體、關系、賓語），將三元組整合至開放知識圖譜（KG）。通過嵌入模型識別同義詞，增強知識圖譜的連接性，將原始段落與知識圖譜結合，形成包含概念與上下文信息的復合知識圖譜。
在線檢索（Online Retrieval）：
- 查詢鏈接：使用嵌入模型將查詢與KG中的三元組和段落進行匹配，以確定圖搜索的起始節點。
- 三元組過濾：使用LLM對檢索到的三元組進行過濾，剔除無關信息，保留與查詢高度相關的知識。
- 個性化PageRank算法：基于KG的結構，運用個性化PageRank算法進行上下文感知檢索，動態調整檢索結果的相關性。
- 段落排名與問答：根據PageRank得分對段落進行排序，將排名靠前的段落作為上下文輸入到最終的問答模型中。
個性化PageRank算法：HippoRAG 2的核心技術之一，通過模擬人類記憶中的多跳推理過程，在知識圖譜中進行深入搜索，以更好地處理復雜的關聯性任務。
深度段落整合：將段落與知識圖譜中的節點進行深度融合，保留段落的上下文信息，增強知識圖譜的語義豐富性，使檢索結果更加相關和準確。