AIGC動態歡迎閱讀
原標題:豆包大模型團隊發布全新Detail Image Caption評估基準,提升VLM Caption評測可靠性
關鍵字:字節跳動,模型,指標,數據,豆包
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com當前的視覺語言模型(VLM)主要通過 QA 問答形式進行性能評測,而缺乏對模型基礎理解能力的評測,例如 detail image caption 性能的可靠評測手段。
針對這一問題,中科院、北大和字節豆包大模型團隊發布了 DetailCaps-4870 數據集,并提出了一種有效的評估指標 CAPTURE,取得了開源評估指標中最高的專家評價一致性,并低成本實現了與 GPT-Eval 可比的效果。論文:https://arxiv.org/abs/2405.19092
數據集:https://huggingface.co/datasets/foundation-multimodal-models/DetailCaps-4870
代碼:https://github.c
原文鏈接:豆包大模型團隊發布全新Detail Image Caption評估基準,提升VLM Caption評測可靠性
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...