突破視頻多模態(tài)大模型瓶頸!「合成數(shù)據(jù)」立大功,項(xiàng)目已開源

AIGC動態(tài)歡迎閱讀
原標(biāo)題:突破視頻多模態(tài)大模型瓶頸!「合成數(shù)據(jù)」立大功,項(xiàng)目已開源
關(guān)鍵字:視頻,字節(jié)跳動,數(shù)據(jù),模型,指令
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者來自字節(jié)跳動,南洋理工大學(xué) S-Lab 和北京郵電大學(xué)。其中第一作者為南洋理工大學(xué) S-Lab 的博士生 Yuanhan Zhang (https://zhangyuanhan-ai.github.io/),主要研究領(lǐng)域?yàn)閷⒒A(chǔ)模型適配于開放世界。本文的指導(dǎo)老師為 Ziwei Liu 教授 ((https://liuziwei7.github.io/) 和 Chunyuan Li 博士 (https://chunyuan.li/), 其中 Chunyuan Li 領(lǐng)導(dǎo)了這個項(xiàng)目。本文其他作者包括北京郵電大學(xué) Jinming Wu,南洋理工大學(xué) S-Lab 的博士生 Bo Li, 字節(jié)跳動研究員 Wei Li, Zejun Ma.
視頻多模態(tài)大模型(LM
原文鏈接:突破視頻多模態(tài)大模型瓶頸!「合成數(shù)據(jù)」立大功,項(xiàng)目已開源
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號