標簽:語義
阿里文生視頻挑戰Gen-2、Pika,1280×720分辨率無壓力,3500萬文本-視頻對顯奇效
機器之心報道編輯:張倩、陳萍文生視頻領域又卷起來了!文生視頻可以精細到什么程度?最近,阿里巴巴的一項研究給出了答案:1280×720 分辨率沒有壓力,而且生...
后期狂喜!一張照片絲滑替換視頻主角,動作幅度再大也OK|Meta&新加坡國立大學
豐色 發自 凹非寺量子位 | 公眾號 QbitAI后期狂喜了家人們~現在,只需一張圖片就能替換視頻主角,效果還是如此的絲滑!且看這個叫做“VideoSwap”的新視頻編輯...
讓3D編輯像PS一樣簡單,新算法GaussianEditor在幾分鐘內完成3D場景增刪改
機器之心專欄機器之心編輯部3D 編輯在游戲和虛擬現實等領域中發揮著至關重要的作用,然而之前的 3D 編輯苦于耗時間長以及可控性差等問題,很難應用到實際場景...
「無需配對數據」就能學習!浙大等提出連接多模態對比表征C-MCR|NeurIPS 2023
新智元報道編輯:LRS 好困【新智元導讀】C-MCR利用現有多模態對比表征間可能存在的重疊模態,來連接不同的對比表征,從而學到更多模態間的對齊關系,實現了在...
用AI大模型「改造」QQ瀏覽器搜索,騰訊獨家揭秘
機器之心專欄作者:周天華、馬晉、劉杰騰訊QQ瀏覽器搜索應用部1:引言自從搜索引擎問世以來,信息檢索算法歷經多次技術更迭,其演進的歷程可大致歸納為四個技...
港大開源推薦系統新范式RLMRec!大模型加持,準確提煉用戶/商品文本畫像
新智元報道編輯:LRS【新智元導讀】本文提出了一種簡易且高效的基于大語言模型的表征學習(Representation Learning)范式。基于該范式模型無關的特性,將其...
浙大拿下唯一最佳論文獎,中國團隊喜獲三項大獎!ACM MultiMedia 2023獎項揭幕
新智元報道編輯:LRS【新智元導讀】ACM MM 2023上中國團隊獲三項大獎,多媒體領域再獲新突破。近日,2023 ACM MultiMedia會議落下帷幕,中國大陸團隊在這次國...
用語言對齊多模態信息,北大騰訊等提出LanguageBind,刷新多個榜單
機器之心專欄機器之心編輯部北京大學與騰訊等機構的研究者們提出了多模態對齊框架 ——LanguageBind。該框架在視頻、音頻、文本、深度圖和熱圖像等五種不同模態...
視覺霸主SAM和文圖霸主CLIP強強聯合!蘋果聯合UIUC,發布統一視覺模型SAM-CLIP,或掀起多模態新浪潮
夕小瑤科技說 原創作者 | ZenMoore相信大家對 SAM[1] 并不陌生,它是 Meta 此前發布的 Segment Anything Model (分割一切模型)。一經發布便火遍全網震驚世界...
北大團隊:誘導大模型“幻覺”只需一串亂碼!大小羊駝全中招
kid 投稿自 凹非寺量子位 | 公眾號 QbitAI北大團隊最新研究發現:隨機token都能誘發大模型出現幻覺!比如喂給大模型(Vicuna-7B)一段“亂碼”,它就莫名其妙弄...
“大大震驚”一位CTO:GPT-4V自動駕駛五連測
編者按:GPT-4V的到來,給AI又帶來了無限可能。近日,圖森中國CTO王乃巖在知乎發表的《GPT-4V在自動駕駛中初探》引發了不少關注。在多項測試之后,他本人表示...
CityDreamer:一鍵生成無邊界的3D城市
機器之心專欄機器之心編輯部近些年,3D 自然場景的生成出現了大量的研究工作,但是 3D 城市生成的研究工作還寥寥無幾。這主要是因為 3D 城市生成更難,人類對...
他們是精神嗎?最新研究:AI 語言模型能更好地告訴你
良好的精神健康對我們的整體健康和幸福至關重要。在昨天(10 月 10 日)的世界精神衛生日相關博客中,世界衛生組織(WHO)提到:“全球每八個人中就有一人患有...
西交、清華等發布多模態大模型,有望成為「DALL·E 4」技術路線?和AI一起「白日作夢」
新智元報道編輯:LRS【新智元導讀】DALL·E 3讓我們看到了生成+理解的大語言模型的魔力。就在其發布的同一天,國內的一個新工作引起了社區的關注:DreamLLM。D...
智源開放3億條語義向量模型訓練數據, BGE模型持續迭代更新
機器之心專欄機器之心編輯部伴隨著大模型開發和應用的火熱發展,作為大模型核心基礎組件的 Embedding 重要性愈發凸顯。智源于一月前發布的開源可商用中英文語...