一段式端到端,世界模型,VLA,VLM,如今智能驾驶圈子听不懂的汽车黑话是越来

数据里奥斯啊 2025-10-15 13:04:54

一段式端到端 ,世界模型,VLA,VLM,如今智能驾驶圈子听不懂的汽车黑话是越来越多了,粗略来看功能,又只能笼统的概括成全国都能开。那体验是不是真的没有高下之分了呢?我觉得也还是可以从体验和技术上聊聊。

从体验上来说,不同的全国都能开,能力边界差别还是很大的。从主要道路都能开到调头,待转区,ETC抬杆能搞定,需要有更完善的感知和控制能力。再到高速,城区,泊车一体化,需要具备完善的道路拓扑结构实时理解能力,看的更远,对距离的把控更精准。更进一步,面对交警手势,甚至是像FSD V14提现出的drive through 取餐场景,就更需要进一步融合对世界各种场景的语义化理解能力。

而更困难的,是面对多重相互冲突的逻辑,如何取舍和判断,比如右转车道施工占用,有施工人员手势引导,需要从直行道右转等等,车辆需要统一理解过去几秒甚至几十秒的场景,并对接下来自己的行为做出多种预测和取舍。而这一切,需要在很短的时间决策,同时考虑所有情况,才可以展现出类似老司机的丝滑而稳定的决策,像之前和一起体验的HSD工程版,在徐汇体育馆如此狭窄拥堵的地段穿行了几个小时,几乎没有突兀刹停,最后困的我睡着了,它说是一段式端到端,我觉得可以信[doge]

这其实和人类司机的进阶很像,新手司机往往经验不足,只能考虑很短距离内跟车的情况,而忽视侧边来车,原处施工等场景,往往危险到眼前,才会下意识的干预,急刹车,危险自然接踵而至。

而老司机盯着导航的前方拥堵,看着临时改道,预判着闯红灯在盲区的行人,就会做出更多预防性驾驶,看似波澜不惊,实际上早就将各种危险反复权衡考虑。

而这种转变,正是一段式端到端和世界模型,VLA技术的价值。将感知决策执行融为一体的一段式端到端,让系统真正具备了感知信息直接转换为动作的能力,叠加上世界模型大量的,长尾的,完整的数据输入,让车辆具备了更完整统一的决策输出能力,同时像VLA技术,可以让这个强大,但是有些黑盒的模型,辅助输出更多人类可以理解的指令和动作,同时也可以融入对于人的需要,周边动作的反应,这让智驾更接近于人开车,而不是机器思维带来了可能。

所以,智驾黑话再多,最终也要落到体验上,所言非虚,不管吹的有多厉害,最终实际丝滑稳定可解释的体验,会让车主做出最终的选择。辅助驾驶功能

0 阅读:9
数据里奥斯啊

数据里奥斯啊

感谢大家的关注