万益资讯网

标题:阿里重磅发布WanStreamer!AI数字人终于能像真人一样跟你视频聊天

标题:阿里重磅发布WanStreamer!AI数字人终于能像真人一样跟你视频聊天了


你有没有发现,以前所有的AI数字人都是假互动?你说完一段话,等半天它才开口,想打断它根本做不到,表情僵硬、口型对不上声音,跟它视频就像对着一台机器,特别别扭。很多人都以为,这就是目前AI能做到的极限了,可阿里这次直接打破了这个僵局。
阿里刚刚发布的WanStreamer全双工模型,彻底推翻了原来AI交互的模式。
以往的AI系统,就像分工繁杂的剧组,识别声音、理解文字、生成画面、配音说话,分成好几个独立模块,一环扣一环,只要一个环节慢了,整体就卡顿,没办法做到实时交流。而WanStreamer把所有功能整合在一个模型里,不用额外拼接任何组件,边看你的表情、边听你说话,一边思考一边做出回应,全程同步完成。
只有200毫秒的超低延迟,算上网络传输,整体延迟也才半秒左右,25帧流畅画面,你说话的时候它会自然点头、皱眉倾听,你中途想插话打断,它能立刻反应过来,调整表情和说话内容,口型、声音、神态完全同步,再也没有生硬的等待间隔。
不过也要客观说清楚,现在只是初代测试版本,画质还比较普通,优先解决的是实时交互问题,高清版本还需要后续打磨,并不是已经完美落地商用。这项技术不是简单优化数字人外表,而是改变了人和AI沟通的底层逻辑,从以前“你一问我一答”的回合制,变成了真人面对面的自然交流。以后智能客服、线上陪伴、远程教学,都会彻底改变模样,不用再死板等待AI回复,沟通会变得无比自然。

科技一直都在悄悄拉近人和智能的距离。以前我们总觉得AI冰冷、有距离感,隔着屏幕始终像两个世界。而阿里这次WanStreamer的出现,让AI慢慢拥有了“共情沟通”的能力。
未来不远,我们身边会出现能真正听懂情绪、懂得回应的智能伙伴,不用刻意配合机器的节奏,交流随心、自然自在。科技发展的最终目的,从来都不是制造冰冷的程序,而是让生活变得更温暖、更便捷。
阿里AI程序员 阿里AI生态 ai对话互动 阿里AI新硬件 AI互动技术 阿里AI硬件