AIGC動態歡迎閱讀
原標題:ACL 2024 Oral|我們離真正的多模態思維鏈推理還有多遠?
關鍵字:模型,研究者,基準,思維,樣本
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com該文章的第一作者陳麒光,目前就讀于哈工大賽爾實驗室。他的主要研究方向包括大模型思維鏈、跨語言大模型等。
在過去的幾年中,大型語言模型(Large Language Models, LLMs)在自然語言處理(NLP)領域取得了突破性的進展。這些模型不僅能夠理解復雜的語境,還能夠生成連貫且邏輯嚴謹的文本。
然而,隨著科技的發展和應用場景的多樣化,單一文本模態的能力顯然已經不能滿足現代需求。人們日益期待能夠處理和理解多種模態信息(如圖像、視頻、音頻等)的智能系統,以應對更復雜的任務和場景。研究者們開始嘗試將文本 CoT 的能力擴展到多模態思維鏈推理領域,以應對更加復雜和多樣化的任務需求。
最早的多模態思維鏈研究之一是由 Lu 等人 [1] 引入的 ScienceQA
原文鏈接:ACL 2024 Oral|我們離真正的多模態思維鏈推理還有多遠?
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...