<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        SmolDocling

        AI工具5個月前更新 AI工具集
        1,056 0 0

        SmolDocling – 輕量級的多模態文檔處理模型

        SmolDocling是什么

        SmolDocling(SmolDocling-256M-preview)是一款高效且輕量化的多模態文檔處理模型,能夠將文檔圖像轉換為結構化文本。該模型支持識別文本、公式、圖表等多種元素,廣泛適用于學術論文、技術報告等各種類型的文檔。其參數量僅為256M,推理速度極快,在A100 GPU上處理每頁文檔僅需0.35秒,并與Docling兼容,能夠導出多種格式。

        SmolDocling

        SmolDocling的主要功能

        • 多模態文檔轉換:高效將圖像文檔轉化為結構化文本,適用于科學和非科學文獻。
        • 快速推理:在A100 GPU上,每頁文檔處理時間僅需0.35秒,顯存使用不到500MB。
        • OCR與布局識別:具備光學字符識別(OCR)功能,能夠保持文檔結構和元素的邊界框。
        • 復雜元素識別:識別代碼塊、數學公式、圖表和表格等復雜文檔要素。
        • 與Docling無縫集成:支持將結果導出為多種格式(如Markdown、HTML等),與Docling完全兼容。
        • 指令支持:支持多種指令,如將頁面轉換為Docling格式、將圖表轉換為表格、將公式轉換為LaTeX等。

        SmolDocling的技術原理

        • 輕量級設計:SmolDocling-256M-preview僅包含256M參數,專為文檔光學字符識別(OCR)和轉換而設計,能在消費級GPU上高效處理文檔,處理每頁文檔的時間僅需0.35秒。
        • 視覺骨干網絡:采用SigLIP base patch-16/512作為視覺骨干網絡,參數量為93M,能夠高效處理圖像輸入,通過像素壓縮技術將每個512×512的圖像塊壓縮為64個視覺標記,顯著降低計算資源需求。
        • 文本編碼器:使用SmolLM-2作為文本編碼器,參數量為135M,處理文本輸入并與視覺信息融合。
        • 多模態融合與輸出:可接收圖像和文本的多模態輸入,生成結構化文本輸出,支持多種文檔處理功能,如將文檔圖像轉為結構化文本、提取圖表和表格信息、將數學公式轉換為LaTeX格式等。
        • 優化的數據集與訓練策略:訓練數據集涵蓋科學與非科學文檔,文檔理解占比達到41%。訓練過程中采用更高的像素標記率(4096像素/標記),顯著提升處理效率。

        SmolDocling的項目地址

        SmolDocling的應用場景

        • 文檔轉換與數字化:SmolDocling-256M-preview能夠高效將圖像形式的文檔轉化為結構化文本,同時保留文檔的原始布局及復雜元素(如代碼塊、數學公式、圖表等)。支持多種輸出格式,包括Markdown、HTML等,非常適合文檔的數字化處理。
        • 科學與非科學文檔處理:能夠處理各類非科學內容(如商業文檔、專利文件等),高效識別并提取文檔中的關鍵信息,如公式、圖表和表格。
        • 快速OCR與布局識別:提供高效的光學字符識別(OCR)功能,準確從圖像中提取文本,同時保留文檔的結構和元素邊界框。
        • 移動與低資源設備支持:SmolDocling-256M-preview可在移動設備或資源受限的環境中運行,如智能手機或便攜式計算機。
        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产不卡免费视频| 中文字幕一精品亚洲无线一区| 2020因为爱你带字幕免费观看全集| 国产麻豆一精品一AV一免费| 最近免费中文字幕mv在线电影| 成人毛片免费在线观看| 国产AV无码专区亚洲AV漫画| 搜日本一区二区三区免费高清视频| 免费国产污网站在线观看15| 无码欧精品亚洲日韩一区夜夜嗨| 亚洲AV成人精品网站在线播放| 亚洲午夜无码毛片av久久京东热| 无遮挡呻吟娇喘视频免费播放| 国产在线jyzzjyzz免费麻豆| 国产gv天堂亚洲国产gv刚刚碰| 黄页免费在线观看| 亚洲美女中文字幕| 一级毛片免费播放视频| 亚洲成人免费在线观看| 亚洲制服丝袜第一页| 精品国产一区二区三区免费| 亚洲国产精品第一区二区| 免费的黄网站男人的天堂| 美女被爆羞羞网站免费| 亚洲无mate20pro麻豆| 香蕉视频在线观看免费国产婷婷| 亚洲人精品午夜射精日韩| 理论亚洲区美一区二区三区 | 亚洲A∨精品一区二区三区| 青青久久精品国产免费看| 国产国拍亚洲精品mv在线观看| 亚洲精品V天堂中文字幕| 99久久久精品免费观看国产| 亚洲精品又粗又大又爽A片| 最近最新MV在线观看免费高清| 亚洲国产成人精品无码区在线观看| 114级毛片免费观看| 色噜噜狠狠色综合免费视频| 久久精品国产96精品亚洲 | 无码高潮少妇毛多水多水免费| 高潮毛片无遮挡高清免费视频|