用語(yǔ)言對(duì)齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個(gè)榜單
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用語(yǔ)言對(duì)齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個(gè)榜單
關(guān)鍵字:騰訊,數(shù)據(jù),語(yǔ)言,語(yǔ)義,視頻
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):6505字
內(nèi)容摘要:機(jī)器之心專(zhuān)欄機(jī)器之心編輯部北京大學(xué)與騰訊等機(jī)構(gòu)的研究者們提出了多模態(tài)對(duì)齊框架 ——LanguageBind。該框架在視頻、音頻、文本、深度圖和熱圖像等五種不同模態(tài)的下游任務(wù)中取得了卓越的性能,刷榜多項(xiàng)評(píng)估榜單,這標(biāo)志著多模態(tài)學(xué)習(xí)領(lǐng)域向著「大一統(tǒng)」理念邁進(jìn)了重要一步。在現(xiàn)代社會(huì),信息傳遞和交流不再局限于單一模態(tài)。我們生活在一個(gè)多模態(tài)的世界里,聲音、視頻、文字和深度圖等模態(tài)信息相互交織,共同構(gòu)成了我們…
原文鏈接:點(diǎn)此閱讀原文:用語(yǔ)言對(duì)齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個(gè)榜單
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。
相關(guān)文章

暫無(wú)評(píng)論...