百萬(wàn)token上下文窗口也殺不死向量數(shù)據(jù)庫(kù)?CPU笑了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:百萬(wàn)token上下文窗口也殺不死向量數(shù)據(jù)庫(kù)?CPU笑了
關(guān)鍵字:騰訊,向量,英特爾,數(shù)據(jù)庫(kù),模型
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):8969字
內(nèi)容摘要:
金磊 夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“Claude 3、Gemini 1.5,是要把RAG(檢索增強(qiáng)生成)給搞死了嗎?”
隨著新晉大語(yǔ)言模型們的上下文窗口(Context Window)變得越發(fā)得長(zhǎng),業(yè)界人士針對(duì)“RAG終將消亡”觀點(diǎn)的討論也是愈演愈烈。
之所以如此,是因?yàn)樗鼈兌叨际菫榱私鉀Q大模型的幻覺(jué)問(wèn)題(即那種一本正經(jīng)地胡說(shuō)八道),可以說(shuō)是屬于兩種不同頂尖技術(shù)流派之間的對(duì)峙。
一方面,以Claude 3、Gemini 1.5為代表的流派,陸續(xù)支持200K和100萬(wàn)token的上下文窗口,用大力出奇跡的方式讓大模型能夠精準(zhǔn)檢索到關(guān)鍵信息來(lái)提供準(zhǔn)確答案。
另一方面,RAG則是一種外掛知識(shí)庫(kù),無(wú)縫集成外部資源,為大語(yǔ)言模型提供了準(zhǔn)確和最新的知識(shí),以此來(lái)提高生成內(nèi)容的質(zhì)量。
誠(chéng)然有很多人在體驗(yàn)過(guò)超長(zhǎng)上下文窗口大模型后,覺(jué)得這種方式已經(jīng)讓AI在回答的準(zhǔn)確性上做到了突破,無(wú)需再用RAG:
而且從Claude、Gemini等玩家在測(cè)評(píng)榜單的數(shù)據(jù)來(lái)看,在回答準(zhǔn)確性上的成績(jī)也是屢創(chuàng)新高。
但事實(shí)真是如此嗎?不見(jiàn)得。
因?yàn)樵诖似陂g,與“RAG要消亡了”背道而馳的聲音也是越發(fā)堅(jiān)定:
原文鏈接:百萬(wàn)token上下文窗口也殺不死向量數(shù)據(jù)庫(kù)?CPU笑了
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破