L3的方案还真是百花齐放百家争鸣,有押宝VLA(视觉、语言、动作)的,也有押宝WEWA(云端世界引擎+车端世界行为模型),还有继续死磕E2E(端到端)的,VLA依赖算力和本地蒸馏的大模型,比较取巧,但是风格很拟人,下限很高;WEWE对算力的要求相对没有VLA那么高,没有取巧,相对工作量较大,人力成本高;E2E延时高,上限还低。 但是相对VLA不需要太大的算力,相对WEAW也没有太多工作量,成本是最低的。大概到2027年就看得出来三种方案到底哪一种更厉害了,个人比较看好VLA跟WEWA,至于E2E估计后面算力成本降低,成本优势不存在,应该是会被淘汰的。
你这么一算,好像是这个道理啊
【1点赞】