大模型理解復雜表格，字節&中科大出手了

AIGC動態1年前 (2024)發布量子位

大模型理解復雜表格，字節&中科大出手了

AIGC動態歡迎閱讀

原標題：大模型理解復雜表格，字節&中科大出手了
關鍵字：表格,模型,任務,視覺,結構
文章來源：量子位
內容字數：0字

內容摘要：

允中發自凹非寺量子位 | 公眾號 QbitAI只要一個大模型，就能解決打工人遇到的表格難題！
字節聯手中科大推出了一款統一表格理解大模型，可以以用戶友好的方式解決多種表格理解任務。
同時提出的還有一套開源測試基準，可以更好地評估模型在表格理解任務上的表現。
該模型名為TabPedia，利用多模態大模型，將不同處理表格任務的專有模型進行了整合。
在這之前，不同的任務都有的模型和解決方案，單是找到適合的模型就是已經很讓人頭疼。
而TabPedia通過概念協同（Concept Synergy）機制來實現多個任務、多種源信息的整合協作，打工人再也不用為找模型而煩惱了。
那么，這款新模型都能實現怎樣的效果呢？
無需裁剪識別多表格結構首先來看，在測試數據集上，TabPedia可以在不借助后處理算法的條件下，精準識別表格位置并直接生成無重疊的檢測框。
在判斷出表格位置的基礎之上，對于表格結構識別任務，TabPedia可以繼續生成一系列連續的表格結構元素以及相應的檢測框。
不僅判斷準確，還有效地解決了標記語言（HTML或者Markdown）處理空間坐標的不足和非法語法潛在造成解析錯誤的弊端。

原文鏈接：大模型理解復雜表格，字節&中科大出手了