具身智能不被“卡脖子”!谁掌握高质量物理数据,谁才握有AGI时代入场券

2026-04-17 19:25
上海

数据采集从“游牧时代”走向“中央厨房”

作者/ IT时报 沈毅斌

编辑/ 孙妍

在2026年英伟达GTC大会上,物理AI与具身智能成为全场绝对核心。黄仁勋在主题演讲中多次提及具身智能与物理交互数据的战略价值,并预测“物理AI的ChatGPT时刻即将到来”。

当全球科技巨头纷纷押注具身智能,将其定义为继大模型之后的下一代人工智能浪潮时,一个残酷的现实却摆在行业面前:物理世界的交互数据如同一片“荒漠”,成为卡住万亿赛道的最大瓶颈。

4月16日,智元机器人旗下子公司觅蜂科技在上海张江科学会堂发布一站式物理AI数据服务平台,同步推出MEgo无本体采集硬件、MEgo Engine数据治理引擎,并联合权威机构启动“蜂巢数据共创行动”。

这场发布会不只是一家数据平台的亮相,也标志着具身智能数据生产从依赖零散采集、作坊式处理的“游牧时代”迈入“无本体、全场景、规模化”的新时代。在算法与算力逐步平权的今天,谁掌握高质量物理数据,谁才真正握有通往AGI时代的入场券。

具身智能被“卡脖子”的真相

具身智能赛道风光无限。国务院发展研究中心及海外权威机构预测,2035年中国具身智能市场规模将突破1万亿元人民币,2050年全球体量有望达到5万亿美元,规模比肩全球汽车产业。但光鲜的融资、热闹的展会、科幻的演示背后,全行业正面临一场数据危机。

“当前行业面临严重的数据荒漠,物理AI真机交互数据量不足大语言模型的两万分之一。”觅蜂科技董事长兼 CEO 姚卯青在发布会上坦言道,全球高质量有效物理数据仅约50万小时,而GPT-5级别大模型训练语料折算超过100亿小时,数据量级差距达到数万倍。

更严峻的是,行业深陷三大顽疾:一是标准缺失,各家数据格式、标注规范自成体系,形成数据孤岛;二是质量参差,多模态数据时空不同步、脏数据泛滥,直接导致“垃圾进、垃圾出”;三是供需错配,供给侧空有场景与采集能力,却缺乏标准化治理与流通体系,而需求侧海量刚需无处落地,导致大量算法原型困在实验室无法走向量产。

多位业内人士也坦言,目前不少人形机器人演示依赖“定制化算法+特定场景”,一旦更换环境、更换物体便失效,核心原因就是训练数据不够泛化、不够真实、不够海量。真机采集成本高、效率低,无本体采集精度不足,仿真数据与真实物理世界存在鸿沟,三重矛盾共同构成制约产业落地的最大枷锁。

“算法再强,无数据则无源;愿景再美,无基建则空悬。2026年是具身智能数据元年,数据将决定行业上限,生态决定未来走向。”姚卯青说。

从“买数据”到“造数据”

传统数据服务商“简单采集+批量标注”的老路已很难走通,于是一站式物理AI数据服务平台就此诞生。

一站式物理AI数据服务平台要打造“又全又好又快”的供给体系,实现真机遥操、无本体采集、仿真数据全范式覆盖,打通硬件、软件、平台、运营全链路。《IT时报》记者在现场体验到MEgo系列无本体采集硬件,用双手控制MEgo Gripper夹爪,完成物品分拣、叠衣服等动作数据采集,配合MEgo View头戴式设备可以完成更加精细的动作训练。

现场工作人员介绍,这两款硬件均与精灵G2 Air机器人原生同构,从源头保障采集数据可直接迁移到真机,快速落地自主作业能力,解决“异构数据无法落地”的行业难题。后台的MEgo Engine数据治理引擎,则承担“数据精炼厂”角色,完成数据预处理、空间感知提取、质量评估、多维度标注全流程,让原始数据转化为可直接训练的高质量资产。

“现阶段无本体数据仍无法替代真机数据。”姚卯青道出更多的产业真相,无本体采集依靠视觉重建轨迹,天然存在厘米级误差,而机器人作业需要亚毫米级精度,这就意味着裸手动作无法完全映射到机械臂,必然存在信息损耗,但在一些对精度要求没那么高的环节,比如预训练、表征学习等发挥作用。

姚卯青也给出判断,仿真可做数据增广,但物理资产建模成本高、真实度有限,无法替代真实物理数据。“未来一定是真机、无本体、仿真三者协同,各司其职。”

从商业层面来看,当前国内物理AI真机数据市场价格约500~1000元/小时,无本体采集数据在规模化产能的状态下可能会是真机数据价格的二分之一到三分之一,采集效率大概会是真机两三倍。“如果真机能卖1000元/小时,无本体就是300~400元/小时,如果真机700元/小时,无本体可能是200元/小时。”姚卯青说道。

在采集方式上,姚卯青坦言数据采集采用众包模式具备很大可能性,不过单纯的自由众包模式存在明显弊端,早期尝试中多数参与者采集数据时较为随性,难以遵循严苛的标准规范,无法保障数据质量,因此后续更倾向于“半众包、强管理、标准化上岗”模式,类似美团骑手体系,经过培训、考核、规范后才能接单。

觅蜂设定了清晰目标:2026年实现千万小时级数据产能,2030年冲击百亿小时级,建成全球最大物理AI数据生态。

从作坊式生产走向集中

单个企业的产能终究有限,物理AI数据的爆发必须依靠全产业链协同。为此,觅蜂联合上电科、国家数据标委会、工信部赛迪研究院共同发起蜂巢数据共创行动,北京人形机器人创新中心、灵初智能、帕西尼感知科技等数十家机构成为首批响应单位,目标是打破数据孤岛、统一行业标准、连接全球供需,最终形成“需求方轻松获取数据、供给方精准对接订单”的高效流通网络。

贵州省大数据发展管理局党组书记、局长兼省政府副秘书长朱宗尧表示,觅蜂将西南数据采集基地、全国数据存储节点落地贵州,也是“东数西算”背景下数据工厂的典型样板。依托贵州算力、存力、人力与政策优势,可大幅降低数据生产与存储成本,形成数据价值释放的“贵州范式”。

截至目前,贵州智算规模超160EFLOPS,存储能力达35.89EB,存储成本约为东部沿海城市的50%,数据标注人员规模已超万人。

姚卯青也表示,未来将依托贵州数据出境试点,搭建全球合规流通体系,同时在东南亚、日韩、美国、中东布局采集基地,服务全球客户。

当前物理AI数据仍处于“作坊式生产”阶段,标准不统一导致协作成本极高,而由头部平台联合权威机构牵头制定标准,将加速行业从零散走向集中、从无序走向规范,为后续跨境流通、规模化交易奠定基础。

有效数据将突破千万小时

一站式物理AI数据服务平台的亮相,折射出具身智能产业的底层逻辑切换:过去行业聚焦算法模型与硬件本体,陷入“内卷式”竞争;现在全行业达成共识是“数据是新石油”,没有高质量、规模化、标准化的物理数据,一切智能都是空中楼阁。

行业已经呈现三大清晰走向:第一,采集范式多元化,真机、无本体、仿真数据互补共存,无本体采集以低成本、高效率成为预训练主流,真机数据坚守落地场景刚需,仿真数据负责泛化与验证;第二,供给模式平台化,分散采集转向集中式、标准化的数据工厂,像水电一样即取即用;第三,生态格局全球化,数据标准统一、跨境流通合规化,全球供需网络形成,推动具身智能从区域试点走向全球普及。

在圆桌论坛上,多位业内人士连续给出关键判断:具身智能目前仍处于类似大模型的Bert时代,尚未出现GPT级智能涌现,百亿小时级高质量数据将是触发涌现的关键阈值。从当前50万小时到百亿小时,行业至少需要4~5年追赶期。

随着觅蜂这类数据基础设施落地,叠加蜂巢生态的协同效应,预计2026年底全产业有效数据量级将突破千万小时。

排版/ 季嘉颖

图片/ 觅蜂科技

来源/《IT时报》公众号vittimes

E N D

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。