ICLR 2025|高效重建幾何精準(zhǔn)的大規(guī)模復(fù)雜三維場(chǎng)景,中科院提出CityGaussianV2
能夠在快速實(shí)現(xiàn)訓(xùn)練和壓縮的同時(shí),得到精準(zhǔn)的幾何結(jié)構(gòu)與逼真的實(shí)時(shí)渲染體驗(yàn)。
原標(biāo)題:ICLR 2025|高效重建幾何精準(zhǔn)的大規(guī)模復(fù)雜三維場(chǎng)景,中科院提出CityGaussianV2
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):6578字
高效精準(zhǔn)重建大規(guī)模復(fù)雜場(chǎng)景:CityGaussianV2算法詳解
機(jī)器之心AIxiv專欄報(bào)道了中科院自動(dòng)化所研究團(tuán)隊(duì)提出的CityGaussianV2算法,該算法用于大規(guī)模復(fù)雜三維場(chǎng)景的高效重建,已接受于ICLR 2025,并開源代碼。
1. 背景與挑戰(zhàn)
三維場(chǎng)景重建旨在從圖像恢復(fù)場(chǎng)景的三維結(jié)構(gòu),追求精準(zhǔn)幾何和逼真渲染。3D Gaussian Splatting (3DGS)因其效率優(yōu)勢(shì)成為主流,但其離散表征難以精確擬合物體表面,重建幾何精度不足。SuGaR、2DGS、GOF等改進(jìn)算法在小場(chǎng)景表現(xiàn)出色,但在大型復(fù)雜場(chǎng)景中面臨更大挑戰(zhàn),例如幾何精度下降、顯存、訓(xùn)練耗時(shí)過長(zhǎng)等問題,且缺乏有效的幾何重建質(zhì)量評(píng)估手段。
2. CityGaussianV2算法介紹
CityGaussianV2繼承了CityGaussian的子模型劃分和數(shù)據(jù)分配方案,并使用2DGS作為基元。針對(duì)大規(guī)模場(chǎng)景重建的挑戰(zhàn),它主要進(jìn)行了以下優(yōu)化:
- 高斯基元優(yōu)化:引入了基于延展率過濾和梯度解耦的稠密化技術(shù),以及深度回歸監(jiān)督,有效解決了2DGS在大型場(chǎng)景中存在的模糊偽影、基元過度增長(zhǎng)等問題,提升了重建精度和訓(xùn)練穩(wěn)定性。
- 并行訓(xùn)練管線優(yōu)化:合并了訓(xùn)練和壓縮過程,刪除冗余步驟,周期性地刪除重要性低的基元,降低了顯存和存儲(chǔ)開銷,加速了模型收斂速度,并提升了對(duì)低端設(shè)備的友好性。
- 大規(guī)模重建幾何評(píng)估協(xié)議:基于點(diǎn)云的目擊頻次統(tǒng)計(jì),設(shè)計(jì)了針對(duì)大規(guī)模場(chǎng)景欠觀測(cè)區(qū)域的邊界估計(jì)方案,有效規(guī)避了欠觀測(cè)區(qū)域重建效果不穩(wěn)定對(duì)指標(biāo)的影響,使評(píng)估更客觀公正。
3. 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)結(jié)果表明,CityGaussianV2在幾何精度(精度P,召回率R,F(xiàn)1-Score)方面均優(yōu)于現(xiàn)有算法,重建結(jié)果細(xì)節(jié)更準(zhǔn)確、完整性更高,渲染質(zhì)量也與CityGaussian V1相當(dāng)。同時(shí),CityGaussianV2有效解決了顯存問題,顯著減少了訓(xùn)練時(shí)間和顯存開銷,并能將大規(guī)模場(chǎng)景重建結(jié)果以約400M的體積存儲(chǔ)。
4. 總結(jié)
CityGaussianV2算法針對(duì)大規(guī)模復(fù)雜場(chǎng)景高效精準(zhǔn)重建的挑戰(zhàn),提出了一種基于2DGS基元、并行訓(xùn)練和高效壓縮的解決方案。它解決了2DGS在大規(guī)模場(chǎng)景中的收斂速度和擴(kuò)展能力問題,并建立了大規(guī)模場(chǎng)景下的幾何精度評(píng)估基準(zhǔn)。實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的效率、有效性和魯棒性,為大規(guī)模三維場(chǎng)景重建提供了新的技術(shù)方案。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)