ShareGPT4V作者團(tuán)隊(duì)又一力作!百萬高質(zhì)量視頻-字幕數(shù)據(jù)助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:ShareGPT4V作者團(tuán)隊(duì)又一力作!百萬高質(zhì)量視頻–字幕數(shù)據(jù)助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
關(guān)鍵字:視頻,數(shù)據(jù),字幕,模型,研究者
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com繼Sora官宣之后,多模態(tài)大模型在視頻生成方面的應(yīng)用簡直就像井噴一樣涌現(xiàn)出來,LUMA、Gen-3 Alpha等視頻生成模型展現(xiàn)了極佳質(zhì)量的藝術(shù)風(fēng)格和視頻場景的細(xì)節(jié)雕刻能力,文生視頻、圖生視頻的新前沿不斷被擴(kuò)展令大家驚喜不已,抱有期待。????????????????????????????
最近,來自中國科學(xué)技術(shù)大學(xué)、北京大學(xué)、上海 AI Lab等團(tuán)隊(duì)的研究人員發(fā)布了引人矚目的 ShareGPT4Video系列,旨在提升視頻理解和生成能力。????????????論文鏈接: https://arxiv.org/abs/2406.04325v1
項(xiàng)目鏈接:https://sharegpt4video.github.io/
數(shù)據(jù)集鏈接:https://huggi
原文鏈接:ShareGPT4V作者團(tuán)隊(duì)又一力作!百萬高質(zhì)量視頻-字幕數(shù)據(jù)助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)