突破自動駕駛新紀元：港中文、港科大與華為攜手推出MagicDriveDiT！

基于DiT架構設計

原標題：突破自動駕駛視頻生成極限：港中文&港科大&華為聯手推出MagicDriveDiT
文章來源：量子位
內容字數：2317字

MagicDriveDiT：自動駕駛視頻生成的新標準

隨著自動駕駛技術的發展，生成高質量且可控的街景視頻成為了開發自動駕駛應用的關鍵。香港中文大學、香港科技大學與華為聯合推出了MagicDriveDiT，旨在重新定義自動駕駛視頻生成的標準。該系統支持昇騰Ascend NPU與NVIDIA GPU的訓練和推理，利用DiT架構和流匹配技術，顯著提升了視頻生成的質量與復雜場景的表現。

1. 精確場景控制

MagicDriveDiT的一個顯著特點是其精確的場景控制能力。該系統能夠生成多種復雜的行駛路況，例如無信號燈路口讓行、路邊起步變道和夜間行車等。此外，MagicDriveDiT支持對單個物體和復雜自車3D軌跡的精確控制，極大地滿足了自動駕駛應用的需求。

2. 整體設計框架

MagicDriveDiT引入了跨視角一致性模塊，并在STDiT3基礎上提出了MVDiT模塊，以處理多視角視頻合成。該系統的設計還包括額外的控制分支和交叉注意力機制，以處理不同類型的控制信號。通過采用空間-時間條件編碼技術，MagicDriveDiT實現了對時空潛變量的精確控制，使生成的視頻在視覺效果上更為逼真。

3. 漸進式訓練策略

在訓練方法上，MagicDriveDiT發現提升視頻分辨率對生成內容質量的影響顯著。因此，該系統采用了分辨率優先的漸進式訓練策略，加速模型訓練收斂，并逐漸適配更高分辨率和更長的視頻。通過混合數據訓練，MagicDriveDiT還具備了視頻長度外推的能力，能夠直接生成超越訓練長度的視頻。

4. 實驗結果與未來展望

實驗結果顯示，MagicDriveDiT在生成真實街景視頻方面超越了現有方法，不僅在分辨率上取得了突破，在幀數上也實現了顯著提升。該系統的成功為自動駕駛技術的發展提供了強有力的支持，并為未來的研究奠定了基礎。

更多信息可以參考論文和項目地址：論文鏈接，項目地址。

聯系作者

文章來源：量子位
作者微信：
作者簡介：追蹤人工智能新趨勢，關注科技行業新突破

閱讀原文

# AIGC動態 # MagicDriveDiT # 人工智能 # 華為 # 自動駕駛 # 視頻生成

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

突破自動駕駛新紀元：港中文、港科大與華為攜手推出MagicDriveDiT！

基于DiT架構設計

MagicDriveDiT：自動駕駛視頻生成的新標準

1. 精確場景控制

2. 整體設計框架

3. 漸進式訓練策略

4. 實驗結果與未來展望

聯系作者

毛絨絨的AI智能寵物，正在海外流行｜甲子光年

顛覆未來：極飛科技創始人彭斌揭秘改變世界的三大關鍵點

相關文章

暫無評論