<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        通用文檔理解新SOTA,多模態大模型TextMonkey來了

        AIGC動態1年前 (2024)發布 機器之心
        474 0 0

        通用文檔理解新SOTA,多模態大模型TextMonkey來了

        AIGC動態歡迎閱讀

        原標題:通用文檔理解新SOTA,多模態大模型TextMonkey來了
        關鍵字:模型,圖像,文本,分辨率,相似性
        文章來源:機器之心
        內容字數:6946字

        內容摘要:


        機器之心專欄
        機器之心編輯部最近,華中科技大學和金山的研究人員在多模態大模型 Monkey [1](Li et al., CVPR2024)工作的基礎上提出 TextMonkey。在多個場景文本和文檔的測試基準中,TextMonkey 處于國際領先地位,有潛力帶來辦公自動化、智慧教育、智慧金融等行業應用領域的技術變革。論文鏈接:https://arxiv.org/abs/2403.04473
        代碼地址:https://github.com/Yuliang-Liu/Monkey
        TextMonkey 是一個專注于文本相關任務(包括文檔問答和場景文本問答)的多模態大模型(LMM)。相比于 Monkey,TextMonkey 在多個方面進行改進:通過采用零初始化的 Shifted Window Attention,TextMonkey 實現了更高輸入分辨率下的窗口間信息交互;通過使用相似性來過濾出重要的圖像特征,TextMonkey 不僅能夠簡化輸入,還可以提高模型的性能。
        此外,通過擴展多個文本相關任務并將位置信息納入回答,TextMonkey 增強了可解釋性并減少了幻覺。與此同時,Tex


        原文鏈接:通用文檔理解新SOTA,多模態大模型TextMonkey來了

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产成人免费a在线视频app | 亚洲色偷拍区另类无码专区| 毛片视频免费观看| 搡女人真爽免费视频大全| 日韩在线免费看网站| 亚洲日韩aⅴ在线视频| 精品亚洲AV无码一区二区| 国产偷国产偷亚洲高清人| 最近更新免费中文字幕大全| 日本h在线精品免费观看| 四虎影视永久免费观看地址| 亚洲精品视频在线| 噜噜综合亚洲AV中文无码| 成人爽a毛片免费| 国产成人免费a在线视频app| 美女黄网站人色视频免费| aⅴ在线免费观看| 精品国产日韩久久亚洲| 丝袜捆绑调教视频免费区| 麻豆国产精品入口免费观看| 亚洲va无码手机在线电影| 亚洲乱码无人区卡1卡2卡3| 99久久精品免费精品国产| 亚洲国产中文字幕在线观看 | 久久免费福利视频| 国产亚洲AV手机在线观看| 边摸边吃奶边做爽免费视频网站 | 一级特黄aa毛片免费观看| 亚洲色偷偷综合亚洲AVYP| 午夜无码A级毛片免费视频 | 日韩免费精品视频| 亚洲成a人片在线观看无码专区| 色偷偷亚洲第一综合网| 国语成本人片免费av无码 | 亚洲日韩精品无码专区加勒比| 国产免费卡一卡三卡乱码| 可以免费观看的国产视频| 中文字幕亚洲乱码熟女一区二区 | 亚洲激情中文字幕| 免费看AV毛片一区二区三区| 拍拍拍无挡免费视频网站|