ShareGPT4V作者團隊又一力作!百萬高質量視頻-字幕數據助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
AIGC動態(tài)歡迎閱讀
原標題:ShareGPT4V作者團隊又一力作!百萬高質量視頻–字幕數據助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
關鍵字:視頻,數據,字幕,模型,研究者
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發(fā)布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com繼Sora官宣之后,多模態(tài)大模型在視頻生成方面的應用簡直就像井噴一樣涌現出來,LUMA、Gen-3 Alpha等視頻生成模型展現了極佳質量的藝術風格和視頻場景的細節(jié)雕刻能力,文生視頻、圖生視頻的新前沿不斷被擴展令大家驚喜不已,抱有期待。????????????????????????????
最近,來自中國科學技術大學、北京大學、上海 AI Lab等團隊的研究人員發(fā)布了引人矚目的 ShareGPT4Video系列,旨在提升視頻理解和生成能力。????????????論文鏈接: https://arxiv.org/abs/2406.04325v1
項目鏈接:https://sharegpt4video.github.io/
數據集鏈接:https://huggi
原文鏈接:ShareGPT4V作者團隊又一力作!百萬高質量視頻-字幕數據助力社區(qū)提升多模態(tài)大模型視頻理解及生成能力
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產業(yè)服務平臺