<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        阿里通義實驗室高級算法工程師文束:mPLUG-DocOwl:多模態(tài)文檔理解大模型

        AIGC動態(tài)2年前 (2024)發(fā)布 算法邦
        621 0 0

        阿里通義實驗室高級算法工程師文束:mPLUG-DocOwl:多模態(tài)文檔理解大模型

        AIGC動態(tài)歡迎閱讀

        原標題:阿里通義實驗室高級算法工程師文束:mPLUG-DocOwl:多模態(tài)文檔理解大模型
        關鍵字:模型,阿里巴巴,算法,編碼器,視覺
        文章來源:算法邦
        內(nèi)容字數(shù):1803字

        內(nèi)容摘要:


        1月17日晚7點,智猩猩推出「多模態(tài)大模型線上閉門會」。本次閉門會由阿里巴巴通義實驗室 NLP 高級算法專家嚴明參與出品,并聚焦于大語言模型工具調用 ControlLLM、長視頻理解視覺語言模型 LLaMA-VID和多模態(tài)文檔理解大模型 mPLUG-DocOwl,香港科技大學在讀博士劉兆洋、香港中文大學在讀博士李彥瑋和阿里巴巴通義實驗室高級算法工程師文束將參與主講。
        其中,文束將圍繞主題《mPLUG-DocOwl:多模態(tài)文檔理解大模型》進行直播講解。
        通過對齊視覺編碼器和大型語言模型,多模態(tài)大模型在通用視覺理解上取得了不錯的效果,甚至實現(xiàn)了初步的文字識別能力。然而,由于采用的是低分辨率編碼器,他們依舊難以編碼富含文字信息的高分辨率(>1k x 1k)的文檔類型圖片。
        為了避免重新訓練高分辨率編碼器帶來的訓練代價,我們提出一種形狀適應的切圖模型將高分辨率圖片切割為多個子圖,并由語言模型來理解子圖之間的關系。通過統(tǒng)一多個文檔理解數(shù)據(jù)集的任務形式,搭配精心設計的兩個輔助學習任務,我們的模型經(jīng)過小參數(shù)量的微調在多個文檔理解測試集上達到了 ocr-free 的 SOTA 效果。
        文束目前是阿里巴


        原文鏈接:阿里通義實驗室高級算法工程師文束:mPLUG-DocOwl:多模態(tài)文檔理解大模型

        聯(lián)系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:「算法邦」,隸屬于智猩猩,關注大模型、生成式AI、計算機視覺三大領域的研究與開發(fā),提供技術文章、講座、在線研討會。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲国产精品无码久久九九| 日韩精品视频免费网址| 国产l精品国产亚洲区在线观看| 免费无码一区二区| 亚洲福利视频一区二区| 免费视频成人国产精品网站| 亚洲国产婷婷综合在线精品| 一区二区免费在线观看| 国产亚洲AV夜间福利香蕉149 | 91热久久免费精品99| 亚洲国产精品一区| 毛片免费全部播放无码| 亚洲一卡2卡3卡4卡国产网站| 青青青免费国产在线视频小草| 国产成人亚洲精品无码AV大片| 国产精品久久香蕉免费播放| 老司机精品视频免费| 亚洲熟妇无码乱子AV电影| 国产va在线观看免费| 亚洲国产精品网站久久| 成人a视频片在线观看免费| 国产亚洲欧美在线观看| 国产亚洲一区二区三区在线不卡| a级大片免费观看| 亚洲午夜电影在线观看高清| 美女黄网站人色视频免费国产| 一级毛片免费播放男男| 亚洲av丰满熟妇在线播放| 久久久久国色AV免费看图片| 另类小说亚洲色图| 久久久久亚洲AV无码专区首| 国产麻豆视频免费观看| 一级成人a做片免费| 亚洲色图视频在线观看| 国产做床爱无遮挡免费视频| 波多野结衣免费一区视频| 亚洲人成网站在线在线观看| 亚洲自偷自偷偷色无码中文| 美女视频黄免费亚洲| 国产免费高清69式视频在线观看| 亚洲小视频在线播放|