AIGC動態歡迎閱讀
內容摘要:
允中 發自 凹非寺量子位 | 公眾號 QbitAI只要一個大模型,就能解決打工人遇到的表格難題!
字節聯手中科大推出了一款統一表格理解大模型,可以以用戶友好的方式解決多種表格理解任務。
同時提出的還有一套開源測試基準,可以更好地評估模型在表格理解任務上的表現。
該模型名為TabPedia,利用多模態大模型,將不同處理表格任務的專有模型進行了整合。
在這之前,不同的任務都有的模型和解決方案,單是找到適合的模型就是已經很讓人頭疼。
而TabPedia通過概念協同(Concept Synergy)機制來實現多個任務、多種源信息的整合協作,打工人再也不用為找模型而煩惱了。
那么,這款新模型都能實現怎樣的效果呢?
無需裁剪識別多表格結構首先來看,在測試數據集上,TabPedia可以在不借助后處理算法的條件下,精準識別表格位置并直接生成無重疊的檢測框。
在判斷出表格位置的基礎之上,對于表格結構識別任務,TabPedia可以繼續生成一系列連續的表格結構元素以及相應的檢測框。
不僅判斷準確,還有效地解決了標記語言(HTML或者Markdown)處理空間坐標的不足和非法語法潛在造成解析錯誤的弊端。
原文鏈接:大模型理解復雜表格,字節&中科大出手了
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...