能看AI推理過程的端到端自動(dòng)駕駛,理想在走一條前所未有的路
端到端+VLM大模型,實(shí)現(xiàn)降維打擊。
原標(biāo)題:能看AI推理過程的端到端自動(dòng)駕駛,理想在走一條前所未有的路
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):10466字
理想汽車:端到端智能駕駛的突破與AGI的征程
本文總結(jié)了機(jī)器之心對(duì)理想汽車OTA7.0及端到端智能駕駛技術(shù)的報(bào)道,重點(diǎn)關(guān)注其技術(shù)突破、應(yīng)用場(chǎng)景以及對(duì)未來AGI的展望。
1. OTA7.0及端到端智能駕駛的突破
理想汽車的OTA7.0版本正式推送了其OneModel端到端+VLM智駕系統(tǒng),實(shí)現(xiàn)了“全場(chǎng)景端到端”能力,并行業(yè)首創(chuàng)AI推理可視化功能。這使得AI的決策過程透明化,增強(qiáng)用戶信任感。理想成為全球第二家將端到端技術(shù)應(yīng)用于城市、高速及環(huán)路NOA場(chǎng)景的車企。
該系統(tǒng)覆蓋從車位到車位的全程自動(dòng)駕駛,支持全國(guó)新開通高速、長(zhǎng)隧道等路段,并能應(yīng)對(duì)復(fù)雜路況,如加塞、避讓行人等。其優(yōu)勢(shì)在于更廣的覆蓋面、更聰明的決策和更絲滑的駕駛體驗(yàn)。
2. 端到端+VLM大模型技術(shù)詳解
理想的端到端系統(tǒng)基于BEV架構(gòu),并融合了視覺語言模型(VLM)。端到端模型負(fù)責(zé)大部分場(chǎng)景的駕駛決策,而VLM則處理復(fù)雜場(chǎng)景,例如丁字路口、限行路段等,相當(dāng)于為智能駕駛增加了一道保險(xiǎn)。這類似于人類的“快思考”和“慢思考”模式。
端到端模型通過學(xué)習(xí)海量駕駛數(shù)據(jù),直接生成控制指令,擺脫了對(duì)人工規(guī)則的依賴,實(shí)現(xiàn)“舉一反三”。VLM則能理解環(huán)境,提供駕駛建議,甚至重新規(guī)劃路線。這種組合實(shí)現(xiàn)了高效率、低延遲和快速迭代的優(yōu)勢(shì)。
3. 技術(shù)優(yōu)勢(shì)與未來展望
理想的端到端智能駕駛系統(tǒng)具備高效的信息傳遞、高效計(jì)算和快速迭代等優(yōu)勢(shì)。它能夠理解未知物體,應(yīng)對(duì)復(fù)雜路況,并具備超越視距的導(dǎo)航能力。通過強(qiáng)化學(xué)習(xí)等技術(shù),理想優(yōu)化了模型的駕駛策略,使其更符合人類駕駛習(xí)慣。
理想的目標(biāo)是未來兩年將MPI提升到500公里,并最終實(shí)現(xiàn)對(duì)老司機(jī)駕駛行為的一比一復(fù)刻。 公司將持續(xù)投入AI研發(fā),并將端到端智能駕駛技術(shù)與理想同學(xué)App融合,最終實(shí)現(xiàn)AGI。
4. 理想汽車的AGI戰(zhàn)略
理想汽車將自身定位為人工智能企業(yè),其AGI戰(zhàn)略分為三個(gè)階段:第一階段是增強(qiáng)人類能力;第二階段是成為人類助手,實(shí)現(xiàn)完全自動(dòng)駕駛;第三階段是成為“硅基家人”,能夠自主工作并管理家庭事務(wù)。理想正通過端到端智能駕駛技術(shù)和理想同學(xué)App,逐步實(shí)現(xiàn)這一宏偉目標(biāo)。
總結(jié)來說,理想汽車在端到端智能駕駛領(lǐng)域取得了顯著突破,其技術(shù)優(yōu)勢(shì)和未來戰(zhàn)略布局值得關(guān)注。 通過持續(xù)的研發(fā)投入和數(shù)據(jù)積累,理想有望在自動(dòng)駕駛領(lǐng)域取得更大的成就,并最終推動(dòng)AGI的實(shí)現(xiàn)。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)