AIGC動態歡迎閱讀
原標題:將圖像自動文本化,圖像描述質量更高、更準確了
關鍵字:文本,圖像,模型,圖片,細節
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com皮仁杰:香港科技大學博士三年級學生,師從張潼教授和周曉方教授。于 2024 年獲得蘋果獎學金。目前主要研究方向是多模態大語言模型和數據為中心的 AI。
張鑒殊:大學本科三年級學生,目前在張潼教授的指導下擔任研究實習生,主要研究方向是大語言模型,多模態大語言模型以及持續學習。當下在尋找 2025 fall 博士入學機會。
在當今的多模態大模型的發展中,模型的性能和訓練數據的質量關系十分緊密,可以說是 “數據賦予了模型的絕大多數能力”。
在這其中,圖像 – 文本數據集發揮著至關重要的作用,在圖像理解、文本生成和圖像檢索等多個領域發揮著關鍵作用。
然而,現有的圖像描述數據集主要來源于網絡抓取和人工標注,存在著質量參差不齊、細節缺失、描述噪音多等問題。盡管人類可以
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...