<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態1年前 (2024)發布 算法邦
        501 0 0

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態歡迎閱讀

        原標題:從問題到解法!對于大模型RAG技術的一些復盤思考
        關鍵字:向量,模型,文本,用戶,語義
        文章來源:算法邦
        內容字數:6670字

        內容摘要:


        智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身智能技術研討會、AI智能體技術研討會和中國智算中心創新論壇。掃名,也可咨詢。最近在公司完成了一個內部知識問答應用,實現流程很簡單,實際上就是Langchain那一套:
        對文檔進行切片
        將切片后的文本塊轉變為向量形式存儲至向量庫中
        用戶問題轉換為向量
        匹配用戶問題向量和向量庫中各文本塊向量的相關度
        將最相關的Top 5文本塊和問題拼接起來,形成Prompt輸入給大模型
        將大模型的答案返回給用戶
        具體可以參考下圖,這個流程的打通其實特別容易,基本上1天就能把架子搭起來,然后開發好了API對外服務。并且在嘗試了幾個通用的文檔后,覺得效果也不錯。
        但是,當公司內部真實文檔導入之后,效果急轉直下。
        當時初步分析,有以下幾個原因:
        1. 文檔種類多
        有doc、ppt、excel、pdf,pdf也有掃描版和文字版。
        doc類的文檔相對來說還比較容易處理,畢竟大部分內容是文字,信息密度較高。但是也有少量圖文混排的情況。
        Excel


        原文鏈接:從問題到解法!對于大模型RAG技術的一些復盤思考

        聯系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統思考。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 添bbb免费观看高清视频| 在线播放免费人成视频在线观看| 久久er国产精品免费观看2| 嫩草影院在线播放www免费观看| 99爱视频99爱在线观看免费| 国产成在线观看免费视频| 国产精品四虎在线观看免费| 国产精品亚洲精品日韩已方 | 可以免费看黄视频的网站| 国产老女人精品免费视频| 国产亚洲精品成人a v小说| 亚洲熟妇av一区二区三区下载| 亚洲综合小说另类图片动图| 一级毛片无遮挡免费全部| 亚洲免费视频网址| 亚洲AⅤ优女AV综合久久久| 亚洲午夜久久久精品影院| 久久精品熟女亚洲av麻豆 | 国产精品亚洲а∨无码播放不卡 | 亚洲欧洲av综合色无码| 女人隐私秘视频黄www免费| 亚洲第一成年免费网站| 亚洲午夜无码久久久久| 亚洲精品天堂成人片AV在线播放| 在线观看片免费人成视频无码 | 精品久久久久久国产免费了| 很黄很黄的网站免费的| 国产亚洲精品成人a v小说| 亚洲欧洲无码一区二区三区| 欧洲精品99毛片免费高清观看| 亚洲成a人片在线观看国产| 亚洲一级毛片免观看| 免费无码av片在线观看| 国产成人高清精品免费鸭子| 久久精品国产亚洲AV无码娇色| 一级视频在线免费观看| 在线视频免费国产成人| 久久亚洲私人国产精品| 曰批全过程免费视频在线观看无码 | 女人张开腿给人桶免费视频| 亚洲丁香色婷婷综合欲色啪|