開源視頻版GPT-4o?快速記憶,實(shí)時問答,拿下CVPR'24長視頻問答競賽冠軍
AIGC動態(tài)歡迎閱讀
原標(biāo)題:開源視頻版GPT-4o?快速記憶,實(shí)時問答,拿下CVPR'24長視頻問答競賽冠軍
關(guān)鍵字:字節(jié)跳動,視頻,模型,記憶,能力
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com張顥繼:清華大學(xué)本科生,師從唐彥嵩老師,主要研究方向?yàn)橐曨l理解。
王逸欽:清華大學(xué)深圳研究生院碩士生,師從唐彥嵩老師,主要研究方向?yàn)槎嗄B(tài)學(xué)習(xí)。
唐彥嵩博士:清華大學(xué)深圳研究生院助理教授,主要研究方向?yàn)橐曨l理解與 3D 生成。
劉鏞:清華大學(xué)深圳研究生院博士生,師從唐彥嵩老師,主要研究方向?yàn)橐曈X分割、視頻理解。
馮佳時博士:字節(jié)跳動視覺研究的負(fù)責(zé)人,他的研究領(lǐng)域包括深度學(xué)習(xí)及其在計(jì)算機(jī)視覺中的應(yīng)用。
代季峰博士:清華大學(xué)電子工程系副教授,主要研究方向?yàn)橐曈X基礎(chǔ)模型與自動駕駛。
項(xiàng)目 Leader,靳瀟杰博士:現(xiàn)就職于字節(jié)跳動美國研究院,研究方向包括多模態(tài)基礎(chǔ)模型、生成式學(xué)習(xí)、視頻編輯等。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大
原文鏈接:開源視頻版GPT-4o?快速記憶,實(shí)時問答,拿下CVPR'24長視頻問答競賽冠軍
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺