<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        阿里7B多模態文檔理解大模型拿下新SOTA|開源

        AIGC動態1年前 (2024)發布 量子位
        520 0 0

        阿里7B多模態文檔理解大模型拿下新SOTA|開源

        AIGC動態歡迎閱讀

        原標題:阿里7B多模態文檔理解大模型拿下新SOTA|開源
        關鍵字:文字,圖片,模型,結構,圖表
        文章來源:量子位
        內容字數:8196字

        內容摘要:


        mPLUG團隊 投稿量子位 | 公眾號 QbitAI多模態文檔理解能力新SOTA!
        阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。
        話不多說,先來看效果。
        復雜結構的圖表一鍵識別轉換為Markdown格式:
        不同樣式的圖表都可以:
        更細節的文字識別和定位也能輕松搞定:
        還能對文檔理解給出詳細解釋:
        要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有很多輔助文檔閱讀的產品,有的主要通過OCR系統進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。
        不過,由于文檔圖片類別多樣、文字豐富且排版復雜,難以實現圖表、信息圖、網頁等結構復雜圖片的通用理解。
        當前爆火的多模態大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。
        而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數據集上提升超過10個點,部分數據集上超過智譜17.3B的C


        原文鏈接:阿里7B多模態文檔理解大模型拿下新SOTA|開源

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲av无码一区二区三区观看| 国产精品免费播放| 亚洲人色婷婷成人网站在线观看 | 美女视频黄a视频全免费网站色| 在线观看的免费网站| 亚洲av伊人久久综合密臀性色| 一级日本高清视频免费观看| 亚洲日韩中文在线精品第一| 男男gay做爽爽免费视频| 国产又黄又爽又猛的免费视频播放| 亚洲欧美日韩中文二区 | 免费观看毛片视频| 亚洲国产成人久久精品大牛影视| 午夜色a大片在线观看免费| 亚洲国产精品无码久久九九大片| 性做久久久久免费观看| 在线91精品亚洲网站精品成人| 一级毛片直播亚洲| 国产精品成人69XXX免费视频| 国产成人精品日本亚洲专区61| a级片免费观看视频| 亚洲精品国产成人99久久| 亚洲免费闲人蜜桃| 亚洲另类无码一区二区三区| 四虎免费久久影院| a级在线观看免费| 亚洲精品熟女国产| 国产精品色午夜视频免费看| 一本到卡二卡三卡免费高| 亚洲人成网站在线播放影院在线| 无码国产精品一区二区免费虚拟VR| 亚洲熟妇无码av另类vr影视| 亚洲高清免费视频| 99在线在线视频免费视频观看| 亚洲色精品三区二区一区| 久久久久亚洲av成人无码电影 | 三年片在线观看免费| 亚洲狠狠ady亚洲精品大秀| 国产区卡一卡二卡三乱码免费| a级午夜毛片免费一区二区| 亚洲三级高清免费|