標簽:圖像
GPAvatar:僅需單圖,快速且精準的3D頭像重建及其表情控制
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:楚選耕 頭部虛擬形象的重建對于虛擬現(xiàn)實、在線會議、游戲和電影等行業(yè)的應(yīng)用至關(guān)重要。 該領(lǐng)域的主要目標是忠實地重建頭...
最新!何愷明團隊發(fā)布:打破自回歸圖像生成瓶頸,告別矢量量化
夕小瑤科技說 原創(chuàng)作者 | 21#近日,深度學(xué)習(xí)領(lǐng)域的杰出研究者何愷明及其團隊又放了個大招,推出其團隊最新研究工作,在AI研究領(lǐng)域引起了廣泛關(guān)注。 何愷明202...
微軟Florence-2官宣開源,一統(tǒng)視覺基礎(chǔ)模型!華人團隊聯(lián)手打造
新智元報道編輯:桃子 【新智元導(dǎo)讀】等了半年,微軟視覺基礎(chǔ)模型Florence-2終于開源了。它能夠根據(jù)提示,完成字幕、對象檢測、分割等各種計算機視覺和語言的...
揭秘大模型技術(shù)在快手搜索的應(yīng)用
演講嘉賓 | 許坤 快手搜索部門技術(shù)專家 審核 |傅宇琪、褚杏娟 策劃 | 蔡芳芳 本文整理自快手搜索部門技術(shù)專家許坤在 QCon 2024 北京的分享“大模型技術(shù)在快手...
導(dǎo)師爆料:這篇CVPR最佳學(xué)生論文,從想法到成稿只用一個月,源自業(yè)余靈感
機器之心報道 機器之心編輯部按部就班 vs. 好奇心驅(qū)動,哪個更容易出研究成果?CVPR 2024 的最佳學(xué)生論文,竟然是用一個月的時間寫出來的。 北京時間 6 月 20...
字節(jié)豆包全新圖像Tokenizer:生成圖像最低只需32個token,最高提速410倍
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
PhotoMaker 騰訊推出個性化圖像生成新高度;LawInstruct 首個法律大型指令數(shù)據(jù)集上線
PhotoMaker 是由騰訊與南開大學(xué)聯(lián)合開發(fā)的 AI 圖像生成工具,不僅能夠捕捉人物的面部特征,還能根據(jù)喜好生成逼真的人物圖像,將個性化定制推向了新高度。無論...
斯坦福AI視頻生成工具免費開放!30秒時長,馬斯克看了效果會沉默
一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAI將音頻、圖像、視頻整合進同一工作流,這個由斯坦福初創(chuàng)公司發(fā)布的視頻工具火了! 預(yù)覽版支持生成30S逼真視頻,網(wǎng)友...
超越CVPR 2024方法,DynRefer在區(qū)域級多模態(tài)識別任務(wù)上,多項SOTA
機器之心發(fā)布 機器之心編輯部為了實現(xiàn)高精度的區(qū)域級多模態(tài)理解,本文提出了一種動態(tài)分辨率方案來模擬人類視覺認知系統(tǒng)。本文作者來自于中國科學(xué)院大學(xué)LAMP實...
超1.2萬人參加CVPR 2024,谷歌研究院獲得最佳論文
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自AI科技評論 作者:賴文昕、馬蕊蕾 編輯:陳彩嫻 北京時間今天凌晨,美國西雅圖正在召開的計算機視覺盛會 CVPR 2024 正式公布了最佳論文...
超 1.2 萬人參加 CVPR 2024,谷歌研究院獲得最佳論文
視覺基礎(chǔ)模型與文生視頻成為 CVPR 2024 兩大熱點。作者丨賴文昕 馬蕊蕾 編輯丨陳彩嫻 北京時間今天凌晨,美國西雅圖正在召開的計算機視覺盛會 CVPR 2024 正式...
Runway 全新 Gen-3 視頻生成模型獲網(wǎng)友盛贊:比 Sora 更好
編譯 | 核子可樂 褚杏娟 憑借廣受歡迎的視頻生成工具而聲名大噪的 AI 廠商 Runway 最近發(fā)布了最新版本的 Runway Gen-3。Gen-3 Alpha 是 Runway 在專為大規(guī)模...
王者歸來!AI視頻巨頭Runway深夜發(fā)布Gen-3,演示暴打Sora驚艷網(wǎng)友
新智元報道編輯:Aeneas 桃子 【新智元導(dǎo)讀】太震撼了!AI視頻老牌選手Runway出手了,深夜發(fā)布的Gen-3在保真度、一致性和精細程度上再次重磅升級,畫面細節(jié)直...
王者歸來!Runway震撼發(fā)布Gen3,文生視頻再填重磅!
點擊上方藍字關(guān)注我們“摘要:Runway發(fā)布Gen-3 Alpha,AI視頻生成技術(shù)取得顯著進步,支持多種視頻創(chuàng)作功能,引領(lǐng)行業(yè)新潮流。Runway 推出了其最新力作——Gen-3 ...
姚班天才,前曠視6號員工范浩強團隊發(fā)布肖像動畫生成模型MegActor
夕小瑤科技說 原創(chuàng)作者 | Axe《完蛋!我被大模型包圍了》 不知大家可還記得這個去年底刷爆AI圈的互動游戲,一天之內(nèi)用戶破萬,又一天之內(nèi)因流量過大而關(guān)停,...