AIGC動態歡迎閱讀
原標題:用多模態LLM做自動駕駛決策器,可解釋性有了!比純端到端更擅長處理特殊場景,來自商湯
關鍵字:模型,商湯,系統,車輛,解釋性
文章來源:量子位
內容字數:7248字
內容摘要:
豐色 曹原 發自 凹非寺量子位 | 公眾號 QbitAI用多模態大模型做自動駕駛的決策器,效果居然這么好?
來自商湯的最新自動駕駛大模型DriveMLM,直接在閉環測試最權威榜單CARLA上取得了SOTA成績——
跑分比基線Apollo還要高4.7,令一眾傳統模塊化和端到端方法全都黯然失色。
對于該模型,我們只需將圖像、激光雷達信息、交通規則甚至是乘客需求“一股腦”丟給它,它就能給出駕駛方案——直接能夠控制車輛的那種,并告訴你為什么要這么開。
這不僅讓駕駛邏輯可控、過程具備可解釋性,且更擅長解決特殊和復雜情況。
像什么給緊急車輛讓行?小case:
你說你著急能不能超車?它也能靈活處理(a為超車成功,b為車道不空,拒絕超車):
簡直不要太驚艷~
具體怎么實現,我們扒開論文來看。
多模態LLM自動駕駛難題目前,自動駕駛系統主要有兩種方案,模塊化和端到端。
模塊化方案顧名思義,把自動駕駛任務拆解為感知、定位和規控三個模塊,各模塊各自完成任務,最后輸出車輛控制信號。
而端到端則是一個整體的模型,包含了上述感知、定位等等所有模塊的功能, 最后同樣輸出車輛控制信號。
但這兩種方案,各有各的缺點
原文鏈接:用多模態LLM做自動駕駛決策器,可解釋性有了!比純端到端更擅長處理特殊場景,來自商湯
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...