理想汽車發(fā)布下一代自動(dòng)駕駛架構(gòu)MindVLA 自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬:為汽車賦予類似人類的認(rèn)知和適應(yīng)能力  第1張

  新浪科技訊 3月18日午間消息,理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動(dòng)駕駛物理智能體的關(guān)鍵一步》,分享了理想汽車對(duì)于下一代自動(dòng)駕駛技術(shù)MindVLA的最新思考和進(jìn)展。

  賈鵬表示:“MindVLA是機(jī)器人大模型,它成功整合了空間智能、語言智能和行為智能,一旦跑通物理世界和數(shù)字世界結(jié)合的范式后,將有望賦能更多行業(yè)。MindVLA將把汽車從單純的運(yùn)輸工具轉(zhuǎn)變?yōu)橘N心的專職司機(jī),它能聽得懂、看得見、找得到。我們希望MindVLA能為汽車賦予類似人類的認(rèn)知和適應(yīng)能力,將其轉(zhuǎn)變?yōu)槟軌蛩伎嫉闹悄荏w?!?/p>

  據(jù)介紹,基于端到端+VLM雙系統(tǒng)架構(gòu)的實(shí)踐,及對(duì)前沿技術(shù)的洞察,理想自研VLA模型——MindVLA。VLA是機(jī)器人大模型的新范式,其將賦予自動(dòng)駕駛3D空間理解能力、邏輯推理能力和行為生成能力,讓自動(dòng)駕駛能夠感知、思考和適應(yīng)環(huán)境。

  MindVLA將為用戶帶來全新的產(chǎn)品形態(tài)和產(chǎn)品體驗(yàn),有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機(jī)。“聽得懂”是用戶可以通過語音指令改變車輛的路線和行為; “看得見”是指MindVLA具備通識(shí)能力,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動(dòng)找到用戶;“找得到”意味著車輛可以自主地在地庫、園區(qū)和公共道路上漫游,整個(gè)過程不依賴地圖或?qū)Ш叫畔?,完全依賴MindVLA的空間理解和邏輯推理能力。