RAG 的未來,走向繁榮、重塑還是消亡?
“大學(xué)生GPT、老登Claude、黃毛Gemini”
原標(biāo)題:RAG 的未來,走向繁榮、重塑還是消亡?
文章來源:AI前線
內(nèi)容字?jǐn)?shù):12450字
RAG技術(shù)在企業(yè)落地的挑戰(zhàn)與創(chuàng)新
本文總結(jié)了AICon全球人工智能開發(fā)與應(yīng)用大會2024北京站“RAG在企業(yè)落地的難點與創(chuàng)新”專題圓桌交流的精彩觀點,探討了檢索增強生成(RAG)技術(shù)在企業(yè)應(yīng)用中的局限性、技術(shù)挑戰(zhàn)以及未來發(fā)展趨勢。
1. RAG與O1模型的結(jié)合
百度研究院商業(yè)智能實驗室負(fù)責(zé)人周景博博士提出,RAG技術(shù)對于O1類推理模型的意義何在。百度靈醫(yī)大模型底座技術(shù)負(fù)責(zé)人夏源博士認(rèn)為,O1模型擅長推理,但缺乏真實世界知識,將RAG引入O1模型,能夠補充領(lǐng)域知識,提升其在真實場景中的推理效果,尤其是在醫(yī)療、金融等領(lǐng)域。然而,如何有效標(biāo)注數(shù)據(jù),降低人工成本,是目前面臨的主要挑戰(zhàn)。
2. 數(shù)據(jù)引擎檢索能力的改進
火山引擎技術(shù)專家田昕暉指出,當(dāng)前數(shù)據(jù)引擎與大模型結(jié)合的潛力尚未充分挖掘。他建議進一步探索如何利用“Text to SQL”等技術(shù),更好地利用結(jié)構(gòu)化數(shù)據(jù),提升復(fù)雜查詢的處理能力。阿里云高級技術(shù)專家費躍則從數(shù)據(jù)引擎用戶的角度,指出當(dāng)前向量數(shù)據(jù)庫在索引技術(shù)、查詢鏈路優(yōu)化等方面仍有改進空間,需要更統(tǒng)一的索引協(xié)議和更透明的查詢鏈路。
3. 降低大模型幻覺的策略
Hugging Face Machine Learning Engineer尹一峰建議,可以通過多模型比對、優(yōu)化模型本身、處理輸入輸出等方式來降低大模型幻覺。他將不同的大模型比作不同個性的人,強調(diào)根據(jù)問題的特點選擇合適的模型。此外,通過機器學(xué)習(xí)技巧和數(shù)據(jù)引擎算子,可以提升模型準(zhǔn)確度。
4. RAG開源產(chǎn)品的競爭力與商業(yè)模式
與會專家對RAG開源產(chǎn)品的競爭力及商業(yè)模式進行了探討。阿里云高級技術(shù)專家費躍認(rèn)為,開源產(chǎn)品適合初創(chuàng)公司或快速驗證想法,其商業(yè)模式可能包括SaaS服務(wù)和與云廠商合作。火山引擎技術(shù)專家田昕暉強調(diào),產(chǎn)品的成功取決于其壁壘和生態(tài)系統(tǒng),開源框架在推動和創(chuàng)新方面具有重要作用。Hugging Face Machine Learning Engineer尹一峰則認(rèn)為,目前RAG開源框架的應(yīng)用場景較窄,可能難以像Docker那樣廣泛普及。
5. RAG的未來發(fā)展趨勢
與會專家普遍認(rèn)為,RAG技術(shù)將與Agent技術(shù)結(jié)合,形成更綜合的系統(tǒng)。未來,RAG有可能發(fā)展成類似數(shù)據(jù)庫一樣的基礎(chǔ)設(shè)施,成為大模型系統(tǒng)中的一個重要模塊。同時,RAG也需要發(fā)展出自己的通用范式,形成類似于“Schema”和“Data Model”的概念。
總而言之,RAG技術(shù)在提升大語言模型輸出質(zhì)量方面具有顯著作用,但其在企業(yè)落地中仍面臨諸多挑戰(zhàn)。未來,RAG技術(shù)的發(fā)展方向?qū)⑹桥c其他技術(shù)融合,形成更強大的AI系統(tǒng),并最終發(fā)展成為的基礎(chǔ)設(shè)施。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實踐案例,助你全面擁抱AIGC。