<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態1年前 (2024)發布 算法邦
        501 0 0

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態歡迎閱讀

        原標題:從問題到解法!對于大模型RAG技術的一些復盤思考
        關鍵字:向量,模型,文本,用戶,語義
        文章來源:算法邦
        內容字數:6670字

        內容摘要:


        智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身智能技術研討會、AI智能體技術研討會和中國智算中心創新論壇。掃名,也可咨詢。最近在公司完成了一個內部知識問答應用,實現流程很簡單,實際上就是Langchain那一套:
        對文檔進行切片
        將切片后的文本塊轉變為向量形式存儲至向量庫中
        用戶問題轉換為向量
        匹配用戶問題向量和向量庫中各文本塊向量的相關度
        將最相關的Top 5文本塊和問題拼接起來,形成Prompt輸入給大模型
        將大模型的答案返回給用戶
        具體可以參考下圖,這個流程的打通其實特別容易,基本上1天就能把架子搭起來,然后開發好了API對外服務。并且在嘗試了幾個通用的文檔后,覺得效果也不錯。
        但是,當公司內部真實文檔導入之后,效果急轉直下。
        當時初步分析,有以下幾個原因:
        1. 文檔種類多
        有doc、ppt、excel、pdf,pdf也有掃描版和文字版。
        doc類的文檔相對來說還比較容易處理,畢竟大部分內容是文字,信息密度較高。但是也有少量圖文混排的情況。
        Excel


        原文鏈接:從問題到解法!對于大模型RAG技術的一些復盤思考

        聯系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統思考。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产小视频在线观看免费| 18成禁人视频免费网站| 日本二区免费一片黄2019| 亚洲av极品无码专区在线观看| 30岁的女人韩剧免费观看| 亚洲视频网站在线观看| 99久久久国产精品免费牛牛| 99re视频精品全部免费| 国产亚洲高清不卡在线观看| 亚洲日韩中文字幕无码一区| 无码视频免费一区二三区| 亚洲成a人片在线观看无码| 两个人的视频www免费| 亚洲日韩激情无码一区| 免费一区二区无码东京热| 久久伊人久久亚洲综合| 91九色老熟女免费资源站| 亚洲jizzjizz在线播放久| 成人免费视频观看无遮挡| 色老头综合免费视频| 亚洲自偷自偷偷色无码中文| 中文字幕乱码一区二区免费| 亚洲精品国产啊女成拍色拍| 成人au免费视频影院| 成年大片免费高清在线看黄| 亚洲Aⅴ无码专区在线观看q| 91精品免费在线观看| 粉色视频在线观看www免费| 国产精品亚洲玖玖玖在线观看| a级毛片免费播放| 国产成人精品久久亚洲| 亚洲免费在线视频| 亚洲综合色婷婷在线观看| 免费大黄网站在线看| 久久午夜夜伦鲁鲁片免费无码| 亚洲婷婷国产精品电影人久久| 成人影片一区免费观看| 亚洲免费网站观看视频| 亚洲色WWW成人永久网址| 国产卡二卡三卡四卡免费网址| 免费国产黄网站在线观看动图|