月之暗面對談 Zilliz：長文本和 RAG 如何選擇？

AIGC動態歡迎閱讀

原標題：月之暗面對談 Zilliz：長文本和 RAG 如何選擇？
關鍵字：模型,騰訊,文本,向量,成本
文章來源：Founder Park
內容字數：0字

內容摘要：

關于長文本和 RAG 到底如何選擇，一直有爭論，從基模公司到應用開發者。
今天這篇文章，是來自基模公司月之暗面和中間層 Zilliz 的技術對話，值得一看。
本期討論會參與者：
陳將老師：Zilliz 生態和 AI 平臺負責人
唐飛虎老師：月之暗面研發工程師，開發者關系負責人
主持人：周默：粉碎機，前美元對沖基金投資人，曾在騰訊與微軟從事戰略與投資業務01長文本與RAG通用對比準確率：通常情況下長文本優于RAG
長文本：可更加綜合的去分析所有相關的內容，提取相關數字，生成圖表，效果尚可。
RAG：更適合找到一段或者是幾段可能相關的段落。如果希望大模型能夠對問題有全局的認識，比較困難。如，根據上市公司的2020年財務報表，繪制圖表，直接用RAG可能效果就不是很好。
長文本在準確性上表現好的原因，以及長度與準確性選擇
長文本處理之后，會做對齊和專門的Benchmark測試調整。比如說之前的大海撈針以及騰訊的數星星的Benchmark，這些是更難一些要求，不僅要找到相關的位置，還得把具體的數字給出來。
現在也出現了一些新的關于長文本模型的bench mark，比如legal bench，

原文鏈接：月之暗面對談 Zilliz：長文本和 RAG 如何選擇？