<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        看3.2億幀視頻學(xué)會(huì)3D生成,智源開源See3D:只需單圖即可生成3D場(chǎng)景

        AIGC動(dòng)態(tài)9個(gè)月前發(fā)布 量子位
        331 0 0

        夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI近日,著名AI學(xué)者、斯坦福大學(xué)教授李飛飛團(tuán)隊(duì)WorldLabs推出首個(gè)「空間智能」模型,僅輸入單張圖片,即可生成一個(gè)逼真的3D世界,這被認(rèn)為是邁向空間智能的第一步。幾乎同時(shí),國(guó)內(nèi)智源研究院推出了首個(gè)利用大規(guī)模無(wú)標(biāo)注的互聯(lián)網(wǎng)視頻學(xué)習(xí)的3D生成模型See3D—See Video, Get 3D?!鱏ee3D支持從文本、單視圖和稀疏視圖到3D的生成,同時(shí)還可支持3D編輯與高斯渲染不同于傳統(tǒng)依賴相機(jī)參數(shù)(pose-condition)的3D生成模型,See3D采用全新的視覺條件(visual-condition)技術(shù),僅依賴視頻中的視覺線索,生成相機(jī)方向可控且?guī)缀我恢碌亩嘁暯菆D像。這一方法不依賴于昂貴的3D或相機(jī)標(biāo)注,能夠高效地從多樣化、易獲取的互聯(lián)網(wǎng)視頻中學(xué)習(xí)3D先驗(yàn)。See3D不僅支持零樣本和開放世界的3D生成,還無(wú)需微調(diào)即可執(zhí)行3D編輯、表面重建等任務(wù),展現(xiàn)出在多種3D創(chuàng)作應(yīng)用中的廣泛適用性。相關(guān)的模型、代碼、Demo均已開源,更多技術(shù)細(xì)節(jié)請(qǐng)參考See3D論文。論文地址:https://arxiv.org/abs/2412.06699項(xiàng)目地址:https://vision.baai.ac.cn/see3d效果展示1. 解鎖3D互動(dòng)世界:輸入圖片,生成沉浸式可交互3D場(chǎng)景,實(shí)時(shí)探索真實(shí)空間結(jié)構(gòu)。?(備注:為了實(shí)現(xiàn)實(shí)時(shí)交互式渲染,當(dāng)前對(duì)3D模型和渲染過程進(jìn)行了簡(jiǎn)化,離線渲染真實(shí)效果更佳。)??△實(shí)時(shí)3D交互?2. 基于稀疏圖片的3D重建:輸入稀疏的(3-6張)圖片,模型可生成一個(gè)精細(xì)化的3D場(chǎng)景。△基于6張視圖的3D重建△基于3張視圖的3D重建3.開放世界3D生成:根據(jù)文本提示,生成一副藝術(shù)化的圖片,基于此圖片,模型可生成一個(gè)虛擬化的3D場(chǎng)景。△開放世界3D生成樣例4. 基于單視圖的3D生成:輸入一張真實(shí)場(chǎng)景圖片,模型可生成一個(gè)逼真的3D場(chǎng)景?!骰趩螐垐D片的3D生成研究動(dòng)機(jī)3D數(shù)據(jù)具有完整的幾何結(jié)構(gòu)和相機(jī)信息,能夠提供豐富的多視角信息,是訓(xùn)練3D模型最直接的選擇。然而,現(xiàn)有方法通常依賴人工設(shè)計(jì)(designed artists)、立體匹配(stereo matching)或恢復(fù)結(jié)構(gòu)(Structure from Motion, SfM)等技術(shù)來(lái)收集這些數(shù)據(jù)。盡管經(jīng)過多年發(fā)展,當(dāng)前3D數(shù)據(jù)的積累規(guī)模依然有限,例如DLV3D(0.01M)、RealEstate10K(0.08M)、MVImgNet(0.22M)和Objaverse(0.8M)。這些數(shù)據(jù)的采集過程不僅耗時(shí)且成本高昂,還可能難以實(shí)施,導(dǎo)致其數(shù)據(jù)規(guī)模難以擴(kuò)展,無(wú)法滿足大規(guī)模應(yīng)用的需求。與此不同,人類視覺系統(tǒng)無(wú)需依賴特定的3D表征,僅通過連續(xù)多視角的觀察即可建立對(duì)3D世界的理解。單幀圖像難以實(shí)現(xiàn)這一點(diǎn),而視頻因其天然包含多視角關(guān)聯(lián)性和相機(jī)信息,具備揭示3D結(jié)構(gòu)的潛力。更重要的是,視頻來(lái)源廣泛且易于獲取,具有高度的可擴(kuò)展性?;诖耍琒ee3D提出“SeeVideo,Get3D”的理念,旨在通過視頻中的多視圖信息,讓模型像人類一樣,學(xué)習(xí)并推理物理世界的三維結(jié)構(gòu),而非直接建模其幾何形態(tài)。方法介紹為了實(shí)現(xiàn)可擴(kuò)展的3D生成,See3D提供了一套系統(tǒng)化的解決方案,具體包括:1)數(shù)據(jù)集:團(tuán)隊(duì)提出了一個(gè)視頻數(shù)據(jù)篩選流程,自動(dòng)去除源視頻中多視角不一致或觀察視角不充分的視頻,構(gòu)建了一個(gè)高質(zhì)量、多樣化的大規(guī)模多視角圖像數(shù)據(jù)集WebVi3D。該數(shù)據(jù)集涵蓋來(lái)自1600萬(wàn)個(gè)視頻片段的3.2億幀圖像,可通過自動(dòng)化流程隨互聯(lián)網(wǎng)視頻量的增長(zhǎng)而不斷擴(kuò)充?!鱓ebVi3D數(shù)據(jù)集樣本展示2)模型:標(biāo)注大規(guī)模視頻數(shù)據(jù)的相機(jī)信息成本極高,且在缺乏顯式3D幾何或相機(jī)標(biāo)注的情況下,從視頻中學(xué)習(xí)通用3D先驗(yàn)是更具挑戰(zhàn)的任務(wù)。為解決這一問題,See3D引入了一種新的視覺條件——通過向掩碼視頻數(shù)據(jù)添加時(shí)間依賴噪聲,生成一種純粹的2D歸納視覺信號(hào)。這一視覺信號(hào)支持可擴(kuò)展的多視圖擴(kuò)散模型(MVD)訓(xùn)練,避免對(duì)相機(jī)條件的依賴,實(shí)現(xiàn)了“僅通過視覺獲得3D”的目標(biāo),繞過了昂貴的3D標(biāo)注?!鱏ee3D方法展示3)3D生成框架:See3D學(xué)到的3D先驗(yàn)?zāi)軌蚴挂幌盗?D創(chuàng)作應(yīng)用成為可能,包括基于單視圖的3D生成、稀疏視圖重建以及開放世界場(chǎng)景中的3D編輯等,支持在物體級(jí)與場(chǎng)景級(jí)復(fù)雜相機(jī)軌跡下的長(zhǎng)序列視圖的生成?!骰赟ee3D的多視圖生成優(yōu)勢(shì)a) 數(shù)據(jù)擴(kuò)展性:模型的訓(xùn)練數(shù)據(jù)源自海量互聯(lián)網(wǎng)視頻,相較于傳統(tǒng)3D數(shù)據(jù)集,構(gòu)建的多視圖數(shù)據(jù)集(16M)在規(guī)模上實(shí)現(xiàn)了數(shù)量級(jí)的提升。隨著互聯(lián)網(wǎng)的持續(xù)發(fā)展,該數(shù)據(jù)集可持續(xù)擴(kuò)充,進(jìn)一步增強(qiáng)模型能力的覆蓋范圍。b) 相機(jī)可控性:模型可支持在任意復(fù)雜的相機(jī)軌跡下的場(chǎng)景生成,既可以實(shí)現(xiàn)場(chǎng)景級(jí)別的漫游,也能聚焦于場(chǎng)景內(nèi)特定的物體細(xì)節(jié),提供靈活多樣的視角操控能力。c) 幾何一致性:模型可支持長(zhǎng)序列新視角的生成,保持前后幀視圖的幾何一致性,并遵循真實(shí)三維幾何的物理規(guī)則。即使視角軌跡發(fā)生變化,返回時(shí)場(chǎng)景依然保持高逼真和一致性。總結(jié)通過擴(kuò)大數(shù)據(jù)集規(guī)模,See3D為突破3D生成的技術(shù)瓶頸提供了新的思路,所學(xué)習(xí)到的3D先驗(yàn)為一系列3D創(chuàng)作應(yīng)用提供了支持。希望這項(xiàng)工作能夠引發(fā)3D研究社區(qū)對(duì)大規(guī)模無(wú)相機(jī)標(biāo)注數(shù)據(jù)的關(guān)注,避免高昂的3D數(shù)據(jù)采集成本,同時(shí)縮小與現(xiàn)有強(qiáng)大閉源3D解決方案之間的差距。*本文系量子位獲授權(quán)刊載,觀點(diǎn)僅為作者所有?!辍孔游籕bitAI?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動(dòng)態(tài)一鍵三連「分享」、「點(diǎn)贊」和「在看」科技前沿進(jìn)展日日相見 ~

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 亚洲中文字幕无码mv| 亚洲AV永久无码精品水牛影视| 亚洲国产美女精品久久久久| 日本一道本不卡免费| 日韩亚洲一区二区三区| 国产线视频精品免费观看视频| 中文字幕亚洲一区| 中文字幕无码毛片免费看| 亚洲av中文无码乱人伦在线r▽| 国产一精品一av一免费爽爽| 亚洲Av熟妇高潮30p| 99re在线视频免费观看| 亚洲国产精品久久人人爱| 无码少妇一区二区浪潮免费| 亚洲人成图片网站| 国产禁女女网站免费看| 高清免费久久午夜精品| 亚洲人色婷婷成人网站在线观看| 国产午夜无码精品免费看| 激情内射亚洲一区二区三区| 在线a级毛片免费视频| 黄色免费在线网址| 亚洲午夜国产精品无码老牛影视| 香蕉免费一区二区三区| 日韩亚洲产在线观看| 免费一级毛片免费播放| 大地资源在线资源免费观看| 91久久亚洲国产成人精品性色| 卡1卡2卡3卡4卡5免费视频| 国产成人自产拍免费视频| 久久久久亚洲精品日久生情| 女人被男人桶得好爽免费视频 | 皇色在线视频免费网站| 久久精品亚洲日本波多野结衣 | 亚洲精品中文字幕| 中文字幕亚洲电影| 亚洲天堂免费在线| 72pao国产成视频永久免费| 亚洲精品无码久久毛片波多野吉衣| 午夜免费不卡毛片完整版| 中文字幕在线视频免费观看|