標簽:視圖

2張圖2秒鐘3D重建!這款AI工具火爆GitHub,網友:忘掉Sora

豐色 發自 凹非寺量子位 | 公眾號 QbitAI只需2張圖片,無需測量任何額外數據—— 當當,一個完整的3D小熊就有了: 這個名為DUSt3R的新工具,火得一塌糊涂,才上...
閱讀原文

少樣本輕量化:多個小模型互學習會比大模型好么?

來源 | ACTBIGDATA 作者 |毛乾任、蔣為峰等背景 大型預訓練語言模型(PLM),如 BERT、GPT-3,在自然語言處理應用的發展中扮演著至關重要的角色。為了將這些 ...
閱讀原文

畫個框、輸入文字,面包即刻出現:AI開始在3D場景「無中生有」了

機器之心報道 編輯:陳萍現在,通過文本提示和一個 2D 邊界框,我們就能在 3D 場景中生成對象。看到下面這張圖了沒?一開始,盤子里是沒有東西的,但當你在托...
閱讀原文

只需2分鐘,單視圖3D生成又快又好!北大等提出全新Repaint123方法

新智元報道編輯:LRS 好困 【新智元導讀】將2D擴散模型的強大圖像生成能力與再繪策略的紋理對齊能力結合起來,Repaint123能夠在2分鐘內從零開始生成具有多視...
閱讀原文

你就是超級超級GPU,請看你的高清GPU大腦圖

來源:CreateAMind 國外一位航天飛機工程師個人花了六年多時間從幾百篇論文中梳理繪制而成的大腦功能視圖。 原網站介紹: 人腦是一個高度復雜的電子系統,由...
閱讀原文

用擴散模型監督NeRF,清華文生3D新方法成新SOTA

清華王霞投稿量子位 | 公眾號 QbitAI用文字合成3D圖形的AI模型,又有了新的SOTA! 近日,清華大學劉永進教授課題組提出了一種基于擴散模型的文生3D新方式。 ...
閱讀原文

五官亂飛,張嘴、瞪眼、挑眉,AI都能模仿到位,視頻詐騙要防不住了

機器之心報道編輯:陳萍、小舟不能說完全相同,只能說表情一模一樣。防不住,根本防不住,現在 AI 模仿能力已經發展到這種程度了?你前腳讓自己的五官亂飛,...
閱讀原文

駛向未來,首個多視圖預測+規劃自動駕駛世界模型來了

機器之心專欄機器之心編輯部Drive-WM 模型通過多視圖世界模型,能夠想象不同規劃路線的未來情景,并根據視覺預測獲取相應的獎懲反饋,從而優化當前的路線選擇...
閱讀原文

單個A100生成3D圖像只需30秒,這是Adobe讓文本、圖像都動起來的新方法

機器之心報道編輯:杜偉、佳琪3D 生成是 AI 視覺領域的研究熱點之一。本文中,來自 Adobe 研究院和斯坦福大學等機構的研究者利用基于 transformer 的 3D 大型...
閱讀原文

AI「腦補」畫面太強了!李飛飛團隊新作ZeroNVS,單個視圖360度全場景生成

來源:機器學習研究組訂閱近來,利用3D感知擴散模型訓練模型,然后對單個物體進行SDS蒸餾的研究數不勝數。但是,能夠真正做到「場景級」的畫面生成,從未實現...
閱讀原文

每日 24 億處理:Airbnb 的 Riverbed 技術解析

作者 | Rafal Gancarz 譯者 | 明知山 策劃 | 丁曉昀 Airbnb 開發的 Riverbed 是一個 Lambda 風格的數據框架,用于生成和管理分布式物化視圖。該框架支持 50 ...
閱讀原文

4K畫質3D合成視頻不再卡成幻燈片,新方法將渲染速度提高了30多倍

機器之心報道編輯:張倩、陳萍本文提出了一種突破性的點云表示 4K4D,能夠以 4K 分辨率對動態 3D 場景進行高保真實時渲染,達到了前所未有的渲染速度和令人印...
閱讀原文

文生3D模型大突破!MVDream重磅來襲,一句話生成超逼真三維模型

新智元報道編輯:拉燕【新智元導讀】文生3D模型進步!分數蒸餾采樣下的MVDream,真的有這么神奇嗎?真的有。不得了了!現在只用打幾個字就能創造精美、高質量...
閱讀原文

MVDream:輕松實現從文本到3D渲染圖像

近日,字節跳動研究人員推出了名為MVDream的新技術,它可以僅通過文本描述生成高質量的3D圖像。這種從文本到圖像的生成技術,被稱為“文本到3D”技術,是當前計...
閱讀原文
12