大模型理解復(fù)雜表格,字節(jié)&中科大出手了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:大模型理解復(fù)雜表格,字節(jié)&中科大出手了
關(guān)鍵字:表格,模型,任務(wù),視覺,結(jié)構(gòu)
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI只要一個大模型,就能解決打工人遇到的表格難題!
字節(jié)聯(lián)手中科大推出了一款統(tǒng)一表格理解大模型,可以以用戶友好的方式解決多種表格理解任務(wù)。
同時提出的還有一套開源測試基準(zhǔn),可以更好地評估模型在表格理解任務(wù)上的表現(xiàn)。
該模型名為TabPedia,利用多模態(tài)大模型,將不同處理表格任務(wù)的專有模型進(jìn)行了整合。
在這之前,不同的任務(wù)都有的模型和解決方案,單是找到適合的模型就是已經(jīng)很讓人頭疼。
而TabPedia通過概念協(xié)同(Concept Synergy)機(jī)制來實(shí)現(xiàn)多個任務(wù)、多種源信息的整合協(xié)作,打工人再也不用為找模型而煩惱了。
那么,這款新模型都能實(shí)現(xiàn)怎樣的效果呢?
無需裁剪識別多表格結(jié)構(gòu)首先來看,在測試數(shù)據(jù)集上,TabPedia可以在不借助后處理算法的條件下,精準(zhǔn)識別表格位置并直接生成無重疊的檢測框。
在判斷出表格位置的基礎(chǔ)之上,對于表格結(jié)構(gòu)識別任務(wù),TabPedia可以繼續(xù)生成一系列連續(xù)的表格結(jié)構(gòu)元素以及相應(yīng)的檢測框。
不僅判斷準(zhǔn)確,還有效地解決了標(biāo)記語言(HTML或者M(jìn)arkdown)處理空間坐標(biāo)的不足和非法語法潛在造成解析錯誤的弊端。
原文鏈接:大模型理解復(fù)雜表格,字節(jié)&中科大出手了
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破