ICRA 2025｜清華x光輪：自駕世界模型生成和理解事故場景

可以描述事故發生過程并提供預防建議

原標題：ICRA 2025｜清華x光輪：自駕世界模型生成和理解事故場景
文章來源：機器之心
內容字數：4528字

光輪智能AVD2框架：提升自動駕駛事故場景理解與安全能力

近年來，自動駕駛技術飛速發展，但復雜交通環境下的事故理解和預防仍是巨大挑戰。針對這一問題，光輪智能（Lightwheel）聯合清華大學、香港科技大學等高校的研究團隊，提出了創新的AVD2 (Accident Video Diffusion for Accident Video Description) 框架，旨在提升自動駕駛系統對事故場景的理解和安全能力。

AVD2框架概述
AVD2 框架包含視頻生成和事故分析兩大部分。通過生成與自然語言描述高度一致的事故視頻，并結合自然語言解釋，AVD2能夠更深入地理解事故場景。該框架還貢獻了EMM-AU數據集，以推動事故分析和預防研究。
視頻生成模塊
AVD2利用Open-Sora 1.2模型，通過兩階段微調優化：第一階段基于MM-AU數據集進行預訓練，第二階段利用2000個詳細事故場景視頻進行微調，確保生成視頻與真實場景高度一致。此外，還使用RRDBNet模型進行超分辨率處理，提升視頻質量。
事故分析模塊
事故分析模塊結合視頻理解和自然語言處理技術，完成車輛行為描述和原因分析（以及規避方法）兩個任務。利用Vision-Language Transformer進行多任務學習，生成描述車輛動作的句子，解釋動作原因并提出規避建議。多任務學習方法增強了描述與推理之間的關聯性，提高了整體性能。
模型架構與關鍵技術
AVD2采用SwinBERT處理輸入視頻，生成視頻特征，并輸入到不同的任務模塊進行預測和描述生成。SCST（自我批判序列訓練）機制用于優化生成文本質量。生成和分析模塊緊密配合，提升了系統的透明度和可解釋性。
實驗結果與可視化
實驗結果顯示，AVD2在多種評測指標上優于ADAPT框架。可視化結果展示了AVD2對事故場景的分析能力，例如識別車輛變道未打轉向燈、車速過快等危險行為。
未來展望
團隊計劃進一步優化AVD2框架，并將其應用于光輪智能的端到端自動駕駛應用中，促進自動駕駛技術在產業界的安全落地。

總而言之，AVD2框架通過結合視頻生成和事故分析技術，為提升自動駕駛系統的事故理解和預防能力提供了新的思路和方法，其在提高自動駕駛安全性方面具有重要意義。

聯系作者

文章來源：機器之心
作者微信：
作者簡介：專業的人工智能媒體和產業服務平臺

閱讀原文

# AIGC動態 # 世界模型 # 事故場景生成 # 多模態理解 # 強化學習安全 # 自動駕駛仿真

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

ICRA 2025｜清華x光輪：自駕世界模型生成和理解事故場景

可以描述事故發生過程并提供預防建議

光輪智能AVD2框架：提升自動駕駛事故場景理解與安全能力

AVD2框架概述

視頻生成模塊

事故分析模塊

模型架構與關鍵技術

實驗結果與可視化

未來展望

聯系作者

MWC 2025 | 廣和通發布全矩陣AI解決方案“星云”系列，創新變革端側AI

小米手機的外掛鏡頭很強，但不會顛覆相機｜硬哲學

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點