月之暗面對(duì)談 Zilliz:長文本和 RAG 如何選擇?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:月之暗面對(duì)談 Zilliz:長文本和 RAG 如何選擇?
關(guān)鍵字:模型,騰訊,文本,向量,成本
文章來源:Founder Park
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
關(guān)于長文本和 RAG 到底如何選擇,一直有爭論,從基模公司到應(yīng)用開發(fā)者。
今天這篇文章,是來自基模公司月之暗面和中間層 Zilliz 的技術(shù)對(duì)話,值得一看。
本期討論會(huì)參與者:
陳將老師:Zilliz 生態(tài)和 AI 平臺(tái)負(fù)責(zé)人
唐飛虎老師:月之暗面研發(fā)工程師,開發(fā)者關(guān)系負(fù)責(zé)人
主持人:周默:粉碎機(jī),前美元對(duì)沖基金投資人,曾在騰訊與微軟從事戰(zhàn)略與投資業(yè)務(wù)01長文本與RAG通用對(duì)比準(zhǔn)確率:通常情況下長文本優(yōu)于RAG
長文本:可更加綜合的去分析所有相關(guān)的內(nèi)容,提取相關(guān)數(shù)字,生成圖表,效果尚可。
RAG:更適合找到一段或者是幾段可能相關(guān)的段落。如果希望大模型能夠?qū)栴}有全局的認(rèn)識(shí),比較困難。如,根據(jù)上市公司的2020年財(cái)務(wù)報(bào)表,繪制圖表,直接用RAG可能效果就不是很好。
長文本在準(zhǔn)確性上表現(xiàn)好的原因,以及長度與準(zhǔn)確性選擇
長文本處理之后,會(huì)做對(duì)齊和專門的Benchmark測試調(diào)整。比如說之前的大海撈針以及騰訊的數(shù)星星的Benchmark,這些是更難一些要求,不僅要找到相關(guān)的位置,還得把具體的數(shù)字給出來。
現(xiàn)在也出現(xiàn)了一些新的關(guān)于長文本模型的bench mark,比如legal bench,
原文鏈接:月之暗面對(duì)談 Zilliz:長文本和 RAG 如何選擇?
聯(lián)系作者
文章來源:Founder Park
作者微信:
作者簡介: