合合信息研發總監常揚：大模型RAG技術架構與應用實踐 | 公開課預告

AIGC動態1年前 (2024)發布智猩猩AGI

AIGC動態歡迎閱讀

原標題：合合信息研發總監常揚：大模型RAG技術架構與應用實踐 | 公開課預告
關鍵字：模型,技術,架構,智能,信息
文章來源：智猩猩AGI
內容字數：0字

內容摘要：

隨著大語言模型的興起，其在處理自然語言任務上展現出了強大的能力，但也逐漸暴露出一些問題。大語言模型雖然能夠生成連貫且富有邏輯的文本，但在某些情況下可能會出現“幻覺”，即生成不準確或無根據的內容。而且，大語言模型對于最新的、特定領域的專業知識的掌握可能存在滯后性。
目前主要有兩種途徑解決以上問題：一是微調，二是RAG。微調雖能使模型“學會”私域知識，但是，模型微調工作復雜，從數據準備、算力資源、微調效果到訓練時間，都面臨諸多挑戰，用新數據隨時微調不切實際，每月能更新一次已屬理想狀況。RAG 則為生成式模型與外部世界互動提供了頗具前景的解決辦法。
RAG的全稱是Retrieval-Augmented Generation，中文翻譯為檢索增強生成，是一個為大模型提供外部知識源的概念。通過RAG，可以使大語言模型生成準確且符合上下文的答案，同時能夠減少“幻覺”。
RAG的主要功能類似于搜索引擎，能夠找出與用戶提問最相關的知識或對話歷史，并結合原始提問創建內容豐富的 prompt，引導模型生成準確的輸出。RAG還可分為5個基本流程：知識文檔的準備、嵌入模型（embedding model）、向量

原文鏈接：合合信息研發總監常揚：大模型RAG技術架構與應用實踐 | 公開課預告