<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        GPT-4o弱點暴露了,PDF長文檔閱讀理解僅45分

        AIGC動態(tài)10個月前發(fā)布 量子位
        386 0 0

        GPT-4o弱點暴露了,PDF長文檔閱讀理解僅45分

        AIGC動態(tài)歡迎閱讀

        原標題:GPT-4o弱點暴露了,PDF長文檔閱讀理解僅45分
        關鍵字:模型,問題,信息,能力,內(nèi)容
        文章來源:量子位
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        YuBo Ma 投稿量子位 | 公眾號 QbitAI圖文并茂的PDF長文檔在日常生活中無處不在。過去人們通常使用OCR,layout detection等方法對PDF長文檔進行解析。但隨著多模態(tài)大模型的發(fā)展,PDF長文檔的端到端閱讀理解成為了可能。
        為了評測多模態(tài)大模型在PDF長文檔上的閱讀理解能力,由上海AI Lab領銜提出的MMLongBench-Doc評估基準測試了14個LVLMs(視覺語言大模型)。
        評估結果表明:表現(xiàn)最好的GPT-4o在整體F1分數(shù)上也只達到了 44.9%。
        GPT-4V排名第二,得分30.5%。
        除了這兩個模型,其他被評測LVLMs的表現(xiàn)更是要弱于OCR+LLMs形式。
        這些結果表明,目前的LVLMs在端到端PDF長文檔閱讀任務上雖然表現(xiàn)出了一定的潛力,但仍然還有很大的提升空間。
        135個PDF、1091個問題LVLMs的出現(xiàn)有效促進了文檔理解任務的解決。針對單頁文檔,常見的閉源和開源模型都展示出了相當不錯的表現(xiàn)(DocVQA > 90%;ChartQA > 80%)。然而,日常生活中閱讀的文檔,如論文、財報、宣傳資料,往往有更多的頁數(shù),許多文檔長度可以達到


        原文鏈接:GPT-4o弱點暴露了,PDF長文檔閱讀理解僅45分

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網(wǎng)

        相關文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲一区免费视频| 久久永久免费人妻精品下载| 久久久无码精品亚洲日韩京东传媒| 全免费a级毛片免费看无码| 久别的草原电视剧免费观看| 又大又硬又粗又黄的视频免费看 | 黄页网站在线观看免费高清| 亚洲人成综合在线播放| 亚洲乱码中文字幕久久孕妇黑人| 国产公开免费人成视频| 我想看一级毛片免费的| 99久热只有精品视频免费看| 99精品免费视频| caoporm碰最新免费公开视频| 精品韩国亚洲av无码不卡区| 亚洲黄页网在线观看| 亚洲国产精品yw在线观看| 亚洲国产综合精品中文第一区| 亚洲综合色自拍一区| 国产精品V亚洲精品V日韩精品| 91在线老王精品免费播放| 中文字幕久无码免费久久| h在线看免费视频网站男男| 国产精品亚洲专区在线播放| 亚洲成在人线在线播放无码| 亚洲国产精品SSS在线观看AV| 亚洲综合区小说区激情区| 亚洲精品色婷婷在线影院| 亚洲成a人片在线观看久| 亚洲AⅤ优女AV综合久久久| 四虎免费久久影院| mm1313亚洲精品国产| 亚洲片一区二区三区| 久久亚洲中文字幕精品一区| 国产亚洲成人久久| 国产亚洲3p无码一区二区| 亚洲va中文字幕无码久久 | 国产无遮挡裸体免费视频在线观看 | 在线观看国产区亚洲一区成人 | 一级特级女人18毛片免费视频| 男女超爽视频免费播放|