<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA

        AIGC動態1年前 (2024)發布 新智元
        826 0 0

        OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA

        AIGC動態歡迎閱讀

        原標題:OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA
        關鍵字:文本,任務,視頻,模型,方法
        文章來源:新智元
        內容字數:19412字

        內容摘要:


        新智元報道編輯:LRT
        【新智元導讀】通過提示查詢生成模塊和任務感知適配器,大一統框架VimTS在不同任務間實現更好的協同作用,顯著提升了模型的泛化能力。該方法在多個跨域基準測試中表現優異,尤其在視頻級跨域自適應方面,僅使用圖像數據就實現了比現有端到端視頻識別方法更高的性能。文本端到端識別是一項從圖像或視頻序列中提取文本信息的任務,雖然取得了一些進展,但跨領域文本端到端識別仍然是一個難題,面臨著圖像到圖像和圖像到視頻泛化等跨域自適應的挑戰。圖1 圖(a)和圖(b)是兩種跨域文本端到端識別,包括圖像到圖像和圖像到視頻。TT表示TotalText,IC15代表ICDAR2015,IC13代表視頻ICDAR2013。
        圖像級跨域文本端到端識別面臨樣式、字體、背景等差異挑戰,模型需要具備極強的泛化能力。
        不同數據集間的格式差異也是跨域文本端到端識別重要的問題,如Total-Text和ICDAR2015使用詞級注釋,CTW1500使用行級注釋。視頻級跨域文本端到端識別中,由于視頻文本中存在著如遮擋、場景變化和文本快速等因素,現有靜態圖像的方法在視頻環境通常表現不佳,如圖2所示。圖2 將靜態


        原文鏈接:OCR小模型仍有機會!華科等提出VIMTS:零樣本視頻端到端識別新SOTA

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久久无码精品亚洲日韩蜜桃| 亚洲国产电影av在线网址| 亚洲丁香色婷婷综合欲色啪| 你好老叔电影观看免费| 亚洲色无码专区在线观看| a级在线免费观看| 亚洲乱色熟女一区二区三区丝袜| 一级做a爰片久久毛片免费看 | 久久爰www免费人成| 亚洲VA中文字幕无码一二三区| 最近免费2019中文字幕大全| 亚洲人成网址在线观看| 精品无码AV无码免费专区| 亚洲视频在线观看网址| 成年免费大片黄在线观看岛国| 亚洲精品自偷自拍无码| 国产zzjjzzjj视频全免费| eeuss免费天堂影院| 亚洲欧洲免费视频| 九九九精品成人免费视频| 亚洲AV无码一区二区三区鸳鸯影院| 亚洲A∨午夜成人片精品网站| 国产一级黄片儿免费看| 久久亚洲sm情趣捆绑调教| 国内自产少妇自拍区免费| 污视频网站在线观看免费| 久久99国产亚洲高清观看首页| 69视频免费观看l| 亚洲av成人片在线观看| 国产午夜亚洲不卡| 在线看片v免费观看视频777 | 亚洲色欲久久久久综合网| 99视频有精品视频免费观看| 在线精品亚洲一区二区 | 久久久久久亚洲AV无码专区| 大陆一级毛片免费视频观看| 曰韩无码AV片免费播放不卡| 亚洲美女自拍视频| 九月婷婷亚洲综合在线| 91人成网站色www免费下载| 国产精品亚洲а∨无码播放不卡|