AIGC動態歡迎閱讀
原標題:ACL2024主會:中科院發布表格理解大模型Table-LLaVA,刷榜23項指標
關鍵字:表格,模型,任務,報告,數據
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | Richard
隨著人工智能的飛速發展,讓AI模型像人一樣直接”看懂”表格,進而完成相關任務的能力變得越來越重要。然而,以往的表格理解方法大多依賴于將表格轉換為文本格式再輸入模型,這不僅耗時耗力,在實際應用中獲取高質量文本格式表格也并非易事。那么,AI模型能否直接通過視覺信息理解表格呢?
近日,中科院信工所的研究者們創新性地提出了”多模態表格理解”這一問題,即讓AI模型直接從表格圖像中獲取信息,進而完成問答、推理等下游任務。他們構建了目前最大規模的多模態表格理解數據集MMTab,涵蓋了豐富多樣的表格圖像和任務,并在此基礎上開發了一個強大的多模態表格理解模型Table-LLaVA。
通過巧妙的兩階段訓練,Table-LLaVA展現出了優異的多模態表格理解能力,在23個評測任務上全面超越了現有的多模態大模型,甚至可以和強大的GPT-4V一較高下。
論文標題:Multimodal Table Understanding
論文鏈接:https://arxiv.org/pdf/2406.08100
表格處理,AI的新戰場在大數據時代,表格無處不在。傳統的表格理解方法需
原文鏈接:ACL2024主會:中科院發布表格理解大模型Table-LLaVA,刷榜23項指標
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...