特斯拉被诟病的语音能力终于要迎来突破了吗
上架豆包大模型
之前了解到特斯拉要上grok
要知道现在国内的很多语音厂商还是依赖 ASR NLU TTS(语义理解)的小模型
但是grok是直接从用户语义触发开始就丢给模型处理
模型来做协议的分发 在执行端响应的速度要更快
不过国内的法律法规应该不会让他进来
毕竟语音这东西可以后台储存在云端
涉及国家机密
如果是国内的语音厂商就会好点
技能方面 估计模型检索 还有一些agent都会上线
到时候大家可以期待一下

特斯拉被诟病的语音能力终于要迎来突破了吗
上架豆包大模型
之前了解到特斯拉要上grok
要知道现在国内的很多语音厂商还是依赖 ASR NLU TTS(语义理解)的小模型
但是grok是直接从用户语义触发开始就丢给模型处理
模型来做协议的分发 在执行端响应的速度要更快
不过国内的法律法规应该不会让他进来
毕竟语音这东西可以后台储存在云端
涉及国家机密
如果是国内的语音厂商就会好点
技能方面 估计模型检索 还有一些agent都会上线
到时候大家可以期待一下
