AIGC動態歡迎閱讀
原標題:從問題到解法!對于大模型RAG技術的一些復盤思考
關鍵字:向量,模型,文本,用戶,語義
文章來源:算法邦
內容字數:6670字
內容摘要:
智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身智能技術研討會、AI智能體技術研討會和中國智算中心創新論壇。掃名,也可咨詢。最近在公司完成了一個內部知識問答應用,實現流程很簡單,實際上就是Langchain那一套:
對文檔進行切片
將切片后的文本塊轉變為向量形式存儲至向量庫中
用戶問題轉換為向量
匹配用戶問題向量和向量庫中各文本塊向量的相關度
將最相關的Top 5文本塊和問題拼接起來,形成Prompt輸入給大模型
將大模型的答案返回給用戶
具體可以參考下圖,這個流程的打通其實特別容易,基本上1天就能把架子搭起來,然后開發好了API對外服務。并且在嘗試了幾個通用的文檔后,覺得效果也不錯。
但是,當公司內部真實文檔導入之后,效果急轉直下。
當時初步分析,有以下幾個原因:
1. 文檔種類多
有doc、ppt、excel、pdf,pdf也有掃描版和文字版。
doc類的文檔相對來說還比較容易處理,畢竟大部分內容是文字,信息密度較高。但是也有少量圖文混排的情況。
Excel
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統思考。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...