穹彻智能秦成:具身行业进入新周期,“都在戳泡泡”

澎湃新闻记者 喻琰
2026-06-09 06:57
来源:澎湃新闻

·“当前具身智能行业仍处在早期验证阶段,真正重要的是,机器人能否不依赖遥操,在物理环境中执行真实任务,能否做到完整的自主感知、规划和运行。”在日前举行在澳门举行的BEYOND Expo 2026期间,穹彻智能执行总裁秦成向澎湃科技(www.thepaper.cn)表示。

穹彻智能落地夜间智慧药房场景 来源:穹彻智能公众账号

上海穹彻智能科技有限公司(以下简称“穹彻智能”),是国内具身智能领域里的明星公司。该公司创始人上海交通大学人工智能学院副院长卢策吾教授,曾于2023年在中国计算机学会的官方账号发布文章《具身智能 | CCF专家谈术语》,文中为具身智能下了定义。同年11月,穹彻智能成立,专注于具身智能大脑、系统及相关工具与平台研发。外界对穹彻智能最早的记忆,来自2024年6月,机器人“刮胡子”的Demo出圈。相比跑跳、翻跟头,刮胡子不是一个视觉上最炫的动作,却涉及高精度力控、末端执行、接触安全等能力。

今年年初,穹彻智能推出口袋机采集设备RoboPocket,试图通过更低成本、更灵活的“社会化采集”方式获取真实物理世界数据。近期,穹彻智能首家智能药房正式试运营,尝试让机器人在真实门店里完成接单、取药、扫码、打包等流程。

在此次采访中,秦成向外界解释了穹彻智能这家聚焦具身智能大脑的公司到底在做什么,从“刮胡子”到落地深夜药房“值夜班”,穹彻试图把通用抓取、力控、末端执行和数据闭环放进真实场景中验证。

秦成认为,眼下具身智能行业进入到“戳泡泡”的阶段。此前由于行业里存在太多信息差,大众和部分投资人对具身智能、机器人能力认知并不充分,但现在大家的态度更为谨慎。

在他看来,判断一家所谓“具身智能大脑”公司是否真的具备模型能力,不能只看Demo和估值,而要看更底层的投入:在算力上花了多少钱;团队里是否有足够密度的顶尖机器人和AI人才;是不是有足够的真实世界数采的数据量。

以下是澎湃科技与秦成的对话:

从“刮胡子”到药房:具身大脑走向真实场景

澎湃科技:为什么选择落地深夜药房场景?

秦成:药房本身是一个非常复杂的真实场景,一个不到二十平方米小药房,但里面可能会有3000个SKU(库存单位)。

我们选择药房落地和穹彻智能整个技术体系演进有关。

两年前,我们团队和创始人卢策吾教授发布了通用抓取能力,并把它进一步沉淀为大脑模型中的一项通用技能。随着这项能力从科研进入工程化,再走向正式商业化,药房就成为一个比较自然的落地场景。

在真正进入药房之前,我们也做了大量测试,也搭建了一个约70平方米的模拟测试环境。但到了真实场景中,复杂程度仍然超出我们的预期。

比如传统药房货架可能有两米高,底部也有很低的位置,如果机器人不能升降,就很难真正完成从高处到低处的取货任务。所以我们不是拿着一个既有硬件形态去硬套场景,而是围绕零售场景本身来设计产品。升降能力就是其中一个重要考虑。

此外,我们不需要对门店做大规模改造,打包机加上机器人,大约只需要2.5平方米,所以我们称之为“2.5平方米嵌入式”方案。它的特点是不干扰门店原有营业;同时属于嵌入式部署,只需要微改造,甚至可以不改造。

我们从一开始就不认为机器人只要叠加一个“大脑”,就能轻松在物理世界里落地干活,真实场景落地是一件非常复杂的事,遇到复杂问题怎么办?我们只能死磕。现在每天早上9点,卢策吾教授都会和我一起看运营数据:前一天机器人运行了多少小时,接单率、订单量、成功率怎么样,出现的问题是工程问题、硬件问题,还是算法问题。

目前,药房场景的在手订单已经比较多。接下来更重要的是,如何把这个过程沉淀成SOP(标准化操作流程),并在此基础上实现规模化。

穹彻智能的数采设备 来源:穹彻智能微信公众账号

澎湃科技:目前落地沈阳已经跑通了吗?药房的投资回报周期是怎样的?

秦成:我们现在已经完成三家店的部署,这个阶段相对投资收益,我们更多考虑是能不能跑稳,能不能履单成功,这是最重要的。如果一天10个小时,只运行两个小时就宕机,也没用。

澎湃科技:从形态来看,你们落地药房的并非典型双足人形机器人,而是轮式移动操作机器人,为什么?

秦成:为什么一定要人形?只要能真实干活就好。我们没有执着于做人形,而是看这个形态能不能在真实场景里解决问题。

我们的机器人会先基于门店做空间建模,然后根据订单信息自己移动到对应货架前。取高处货品时,升降柱会升起来,可以取到2.1米左右高度的货架。

我们的“大脑”会控制机器人进行末端快换。比如接下来要取的是玻璃瓶装药水,它会切换到对应的末端执行器,把药品夹取下来,再完成扫码。所有药品取完后,机器人会把药带到门口的打包机处。这是一个完整的场景闭环。

澎湃科技:现在不少具身智能公司都在讲进工厂,为什么你们没有优先选择工业场景?

秦成:从工业场景来看,数据获取相对更难,汽车、工程机械等行业都有各自的工艺流程,行业之间差异很大,更重要的是成本可行性、技术可行性、稳定可靠性和商业价值间的平衡。

所以对创业公司来说,现阶段还是要聚焦。我们希望先聚焦一个行业,把一个行业做深、做大,之后再考虑这个行业与其他行业之间的相似性和关联性。

错误数据和纠偏数据,对机器人未来的泛化能力很重要

澎湃科技:你们推出了口袋机采(RoboPocket),让普通人在家里就能收集数据,这样的方案相比传统工厂采集数据的优势在哪里?

秦成:相对比较简单,可以理解为一套左右手采集装置,末端带有夹爪,上面会搭载iPhone。真正更关键的并不是硬件本身,而是我们在每台iPhone上有一个App。

这个App相当于一位“采集导师”或者数据采集指挥中心,可以向采集者下发任务,指导采集过程,任务完成后,数据会回传到我们自己的数据采集流程里,标注师可以在数据管理平台上进行加注等,也可以对数据质量进行分析。我们可以评判数据质量,包括头戴式采集设备,也会有摄像头提供第一视角数据采集。由于大规模人员在真实场景采集数据,我们更愿意把这种方式称为“社会化采集”

它的优势更灵活,也更容易带到不同场景中,设备方便采集者携带到不同场景,比如酒店、餐饮等,可以一边完成真实操作,一边采集数据,这样会降低数据采集成本,也让数据来源更灵活。

澎湃科技:你们也投资了一家数据公司智域基石,对你们来说,现阶段最缺的是哪一类数据?

秦成:我们合作更多偏向于生态型合作,他们会补齐一些真实场景数据。从目前行业发展来看,机器人模型训练需要大量真实场景中的数据。我并不认为现在的数据量已经足够,这可能在未来一年内都是行业共同面对的问题。

无论进入什么场景,最重要的第一点是要有足够的数据去“喂”模型。而且训练不是简单采集一次标准动作,很多时候还需要错误过程、纠偏过程的数据,这些数据都很重要。

我经常举一个例子,人在厨房切西蓝花,如果西蓝花掉在地上,你会怎么做?你会把它捡起来,用水冲一冲,然后继续切。

但如果机器人训练时没有见过这样的数据,只见过“正常切西蓝花”的过程,那么下一次它遇到西蓝花掉在地上,就不一定能推理出来该怎么处理,因为它没有见过这样的过程。

如果我们有这种真实场景中的数据,就更接近人真实干活的状态,错误数据和纠偏数据,对机器人未来的泛化能力非常重要。

Demo热之后:大脑公司如何证明自己

澎湃科技:对一家做“大脑”的公司来说,现在大脑的智能化程度有多高?

秦成:模型这件事目前最难的点是没有办法证明,行业确实喧嚣,到处在说谁的估值高,谁的模型厉害,这种逻辑确实也存在,但正确与否就不评判了,最终还是要看落地在真实场景里干活。

大家一直在讨论具身智能到了哪个阶段,争论这些完全没有意义。

澎湃科技:很多人说具身智能正在迎来自己“iPhone时刻”,你认为距离真正像PC、手机那样的爆发节点还有多远?中间最大的断层在哪里?

秦成:现在还在很早期阶段,整个具身智能行业也在验证期。手机在进入智能机时代之前,已经有硬件基础和用户习惯,每个人都有手机,只是从传统手机变成智能手机。但机器人不一样,过去并没有机器人生活在我们周围,所以,如果只是交付机器人本体,也许这个说法成立,但如果说要交付一个在真实场景里能够干活、有价值、能批量运行的机器人,那个时刻远没有到来。

现在行业进入一个新的周期,我的体感是大家这一个月都在“戳泡泡”,现在一家公司对外发Demo,大家已经开始在思考是不是在遥操,是不是真的能做到。之前有信息差,大众没有认知。

    责任编辑:宦艳红
    图片编辑:蒋立冬
    校对:施鋆