万益资讯网

每日可产出1600小时、约130TB的合规数据,看看如祺出行的数据金矿是如何生产

每日可产出1600小时、约130TB的合规数据,看看如祺出行的数据金矿是如何生产的。

5月18日,如祺出行首次向外界完整披露其AI数据资产版图。这家扎根大湾区的出行服务平台,正加快将海量真实出行场景数据转化为驱动人工智能迭代的核心资产,向智能驾驶、具身智能、世界模型等前沿领域注入“数据动力”。

据披露,如祺出行旗下数据业务板块(以下简称“如祺数据”)已覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类,形成了从数据采集、规模化处理、精准标注到合成数据及多模态处理的全链路数据服务能力。

如祺出行凭借真实出行场景的长期积累,正以自身优势为基础,加快向大湾区AI行业数据基础设施供应商发展。公开信息显示,如祺数据在大湾区已为腾讯、小马知行、广汽等多家科技及智驾头部企业提供服务。

如祺出行自2023年开始布局、近年持续加码AI数据服务。财报显示,2025年以该业务为主要收入来源的技术服务板块实现营收1.60亿元,同比大增487.4%。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、约130TB的合规数据。

这些数据并非来自实验室或虚拟仿真,而是根植于如祺出行的常态化运营场景。采集车搭载激光雷达、摄像头等多类传感器,在开展出行服务的同时合规采集真实场景中的驾驶行为、人车交互等信息,具备物理世界数据特征,契合当前AI行业,尤其是具身智能、世界模型训练对高质量数据的要求。

行业数据显示,类似的高质量数据全球总量仅约50万小时左右,而头部厂商单年需求量即达百万小时级别,供需极度失衡。在业界普遍将具身智能和世界模型视为“下一个AI主战场”的背景下,这类数据已被视作稀缺性战略资产。

类似如祺出行这样的出行服务平台天然具备生产、积累高价值数据的优势:伴随每年数亿单出行订单和庞大的车辆运行数据,海量司机行车、泊车以及高频交通场景的多模态数据不断涌入平台,并附带“司机决策—车辆响应—环境反馈”的完整链条。

官方信息显示,如祺出行已在全国布局3大数据服务交付基地,拥有超1500人的服务团队、超1000家BPO合作伙伴及近百万众包资源,每月可提供千万级标注产能,满足高并发任务需求。

同时,如祺的合成数据已涵盖不同时段、天气环境及座舱场景,有效弥补真实采集中的盲区;多模态训练数据集则覆盖图像、文本、音频与视频,可直接支持大模型的垂类微调。通过全栈数据服务能力,如祺出行可实现“数据即服务”模式,显著降低客户使用高质量真实数据的门槛。

目前,如祺数据服务已进入智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想、广汽、火山引擎、百度智能云等头部企业,商业化路径已得到初步验证。

如祺出行广汽集团