<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        阿里7B多模態(tài)文檔理解大模型拿下新SOTA|開源

        AIGC動態(tài)1年前 (2024)發(fā)布 量子位
        518 0 0

        阿里7B多模態(tài)文檔理解大模型拿下新SOTA|開源

        AIGC動態(tài)歡迎閱讀

        原標題:阿里7B多模態(tài)文檔理解大模型拿下新SOTA|開源
        關(guān)鍵字:文字,圖片,模型,結(jié)構(gòu),圖表
        文章來源:量子位
        內(nèi)容字數(shù):8196字

        內(nèi)容摘要:


        mPLUG團隊 投稿量子位 | 公眾號 QbitAI多模態(tài)文檔理解能力新SOTA!
        阿里mPLUG團隊發(fā)布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結(jié)構(gòu)理解、指令遵循、外部知識引入四大挑戰(zhàn),提出了一系列解決方案。
        話不多說,先來看效果。
        復(fù)雜結(jié)構(gòu)的圖表一鍵識別轉(zhuǎn)換為Markdown格式:
        不同樣式的圖表都可以:
        更細節(jié)的文字識別和定位也能輕松搞定:
        還能對文檔理解給出詳細解釋:
        要知道,“文檔理解”目前是大語言模型實現(xiàn)落地的一個重要場景,市面上有很多輔助文檔閱讀的產(chǎn)品,有的主要通過OCR系統(tǒng)進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。
        不過,由于文檔圖片類別多樣、文字豐富且排版復(fù)雜,難以實現(xiàn)圖表、信息圖、網(wǎng)頁等結(jié)構(gòu)復(fù)雜圖片的通用理解。
        當(dāng)前爆火的多模態(tài)大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。
        而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數(shù)據(jù)集上提升超過10個點,部分數(shù)據(jù)集上超過智譜17.3B的C


        原文鏈接:阿里7B多模態(tài)文檔理解大模型拿下新SOTA|開源

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 两个人日本WWW免费版 | 99视频免费在线观看| 日本免费v片一二三区| 最新国产精品亚洲| 野花高清在线观看免费3中文 | 19禁啪啪无遮挡免费网站| 久久国产亚洲电影天堂| 免费在线看污视频| 久久久久久a亚洲欧洲AV| 久久一区二区三区免费播放 | 未满十八私人高清免费影院| 亚洲av麻豆aⅴ无码电影| 黄色毛片视频免费| 久久亚洲欧洲国产综合| 最近2019中文免费字幕在线观看| 国产精品亚洲精品日韩已满| 免费人成毛片动漫在线播放| 亚洲精品免费观看| 18国产精品白浆在线观看免费| 国产婷婷综合丁香亚洲欧洲| 日韩一级视频免费观看| 视频免费1区二区三区| 亚洲AV无码专区国产乱码电影| 色欲色香天天天综合网站免费| 亚洲国产成人久久99精品| 女人张开腿等男人桶免费视频| 特级毛片爽www免费版| 亚洲欧洲日韩国产综合在线二区| 99久久免费国产香蕉麻豆| 亚洲精品9999久久久久无码| 亚洲精品无码日韩国产不卡?V| a毛片免费全部播放完整成| 亚洲国产成AV人天堂无码| 国产精品久久免费视频| 成人免费av一区二区三区| 亚洲国产成人久久77| 亚洲AV无码不卡在线观看下载| 久久国产免费一区| 老子影院午夜伦不卡亚洲| 亚洲va久久久噜噜噜久久男同| 成年女人喷潮毛片免费播放|