Rocky问我:为什么大家喜欢转这条weibo?我说不知道[笑cry]。
或许是因为:AI也正经历从辅助智能,向Agent智能体的转换。而语言介入辅助驾驶,恰恰也是L2走向L4的技术路径之一。
我个人觉得,在大部分人的日常驾驶中,端到端VA快系统,可以解决99%的问题,即便是一些防御性驾驶场景,通过优质数据的投喂,仿真环境的强化训练,VA系统也可以处理的很好。
如果我们只追求驾驶辅助,VA 足够用了,1%的长尾问题,人接管就好了,针对一条路线的反复打磨,从成本收益来看,是更务实的。
但问题在于,人性是贪婪的,我们永远想要的更多。
你可以想象一下,人类近100年投入的金钱和成本流向了哪里? 主要流向了科技创新和技术革命。
当辅助驾驶能帮你解决99%的开车问题时,哪怕只剩1%的的长尾问题,你都会贪心让它搞定。
而最近的一次路测,让我更加确信了这一点。我们遇到了某个很有意思的长尾问题。
我把主要过程的连续图片喂给了通义千问VM-L模型、豆包和DeepSeek,你们猜猜这些大语言模型能解这道题吗?
请容我卖个关子,节目上线的时候,再给大家揭晓。
这次路测,让我更加确认一件事,这1%的长尾场景,我们需要智能体才能解决。那它是世界模型吗?是VLA吗?
其实无论是世界模型,还是VLA,它们只是迈向智能体的技术路径,并不是那个答案。