对话智元合伙人姚卯青:具身智能淘汰赛即将开启

对话智元合伙人姚卯青:具身智能淘汰赛即将开启

邴水 2025-04-24 股票指南 35 次浏览 0个评论

界面新闻记者 | 李如嘉

界面新闻编辑 | 文姝琪

在智元位于上海张江机器人谷的数采工厂里,采集人员正在操纵机械臂完成数据采集。从夹取各类物品,到铲猫砂、晾衣服,工厂里设置了多个细分场景,每隔一段时间就会进行更换。去年,智元数采工厂采集了100万条数据,今年希望能有1000万条数据产出。

对话智元合伙人姚卯青:具身智能淘汰赛即将开启

在姚卯青的构想下,如果能够有一亿条真机数据,机器人就可以达到类比ChatGPT-3的智商,与常见物品、设备互动,并与人类进行简单交互。

姚卯青毕业于清华大学电子工程系,曾在Waymo、蔚来汽车等任职。2024年,他加入智元,担任合伙人、具身业务部总裁、具身研究院执行院长,负责AI技术开发及软件研发工作。

成立于2023年的智元机器人,是目前中国估值最高的具身智能企业,最新估值达150亿,融资方有红杉中国、高瓴等投资机构,也有上汽、比亚迪等车企,以及腾讯这样的大厂。

作为曾经的智能驾驶从业者,姚卯青认为,与智能驾驶相比,具身智能虽然在硬件系统架构上非常类似,但在技术、场景和应用等方面都有更大的想象空间,大模型的突破则让大家看到了具身智能成功大规模落地的可能性。

对话智元合伙人姚卯青:具身智能淘汰赛即将开启

他提到,具身智能真正的壁垒在于操控和大脑。而要完成这些,需要大量数据,这也是智元成立数采工厂的原因。他的乐观估计是,再需要五年,机器人或许就可以进入家庭,而在第一阶段,工厂仍是具身智能最大的需求方。

“机器人不是大模型,最终还是要拼硬件、拼制造。”姚卯青在采访中还表示,在机器人实际落地中,管好一万多个零件的供应链,实现规模化量产是一大难关。截至目前,智元已量产下线1000台机器人,今年的出货计划保持在数千台。

在他看来,主流资本已经站好队,留给新成立的公司的机会已经不多,目前牌桌上的玩家要做的就是在更快的创业节奏下,做差异化,做量产和商业闭环。

对话智元合伙人姚卯青:具身智能淘汰赛即将开启
智元机器人合伙人、具身业务部总裁、具身研究院执行院长 姚卯青

以下是界面新闻与智元机器人合伙人姚卯青的采访,略经编辑:

大模型让具身智能的成功初见端倪

界面新闻:你之前在Waymo、蔚来,都是在做智能驾驶,为什么会选择切入机器人赛道?

姚卯青:现在这么多人从智驾切换到机器人赛道,我可以说是最早做出这个选择的。大部分人都是从去年下半年到今年上半年才集中开始换赛道,我在2023年就已经看到具身智能这个新生事物的潜力和想象力,2024年上半年正式开始做机器人。

在机器人之前,我也尝试过智能驾驶的创业,现在比较火的一段式端到端,我在2023年上半年就已经着手在做。但当时在找融资的时候,就发现投资人会觉得自动驾驶好像已经没那么性感了。智能驾驶发展到现在,可以实现的功能还比较有限,商业模式也比较趋同,最终还是作为供应商的角色和车企打交道,生存空间也很有限。当时也有人建议我来做机器人,在了解之后,我觉得它的想象空间会更大。

界面新闻:你当时觉得转型具身智能的机会点在哪里?

姚卯青:智能驾驶和机器人从硬件系统的架构来讲是极其相似的尤其是在电子电器和传感器这一层具体的控制器、执行器可能不一样但是从域控制器以上的维度来讲,两者的系统架构是高度一致的。所以很多过去在智能驾驶工程上、资源上的积累其实都可以直接复制过来。

但从技术上来说,具身智能更适合做大模型。智能驾驶现在所谓端到端的这些模型,其实都还是小模型。也不是说因为技术能力不足做不了大模型,而是智能驾驶本身的特点就是低延时高速、安全要求极高,不能让推理慢且存在幻觉的系统来控制车辆,这是不可能通过安全测试的,所以大家也只能讲讲概念。但在机器人上,像现在我们外面跑的一些算法已经是大模型,虽然没有到几千亿参数,也有几十亿参数。

界面新闻:所以大模型这波热潮也让你对具身智能更有信心?

姚卯青:对,大模型首先确实是一个划时代的东西有了大模型,在2023年具身智能发展早期,谷歌RT-X等几份工作给大家看到了一个新的范式,机器人不用再分模块去做感知、规划与控制,用一个大模型就可以端到端地解决这一整套系统。

智能驾驶是让车从一个结构化的道路从A点走到B点,场景是可预期的,地上有哪些线、哪些交通灯,包括交通规则也是制定好的。但大家对机器人的想象是和人类一样的存在,可以在开放世界里执行任意任务。原来为自动驾驶这样专用功能设计的系统是无法适用于这种通用智能的,是大模型的出现让大家看到了一些成功的端倪。

界面新闻:转型后为什么选择加入智元,你觉得智元和其他公司有什么不一样?

姚卯青:我当时看过很多具身智能的创业公司,其实最初也没有特别关注到智元。后来也是有投资人介绍,交流了几次发现,首先智元确实资金比较充足。不得不承认,资金是最重要的事情。无论是自动驾驶、大模型,还是具身智能,做这些大赛道,前提就是要有钱。其次智元是有规划的,要拿这些钱来坚定投入AI。

虽然整个行业现在还很早期,但从终局来看,AI能力是必备的,否则机器人就没有任何用处。虽然算力、算法工程师、数据这些都很贵,但当时智元已经决定一年要用500台机器人去采数据、做大模型。虽然当时已经有十几亿融资,一年投入这么多在这方面也是风险很大的事情,我觉得这是很难的一个决定。

其次智元整个团队也更加成熟。做公司只有学术是不够的,创业不只是要做科研,还要做生产制造、采购、供应链管理,产品、市场销售战略政府关系、投融资等等,需要非常综合的能力尤其机器人也不是大模型,最终还是要拼硬件、拼制造。现在机器人制造还在一个很初期的阶段,要在产业链很不成熟的情况下,带着供应链慢慢成长,做出一个稳定可量产的产品,你的团队要足够成熟和完整

一亿条数据和五年

界面新闻:刚才提到的大模型主要是在机器人大脑方面的进步。在本体和小脑方面,最近有一些比较大的进展吗?

姚卯青:本体的话,我觉得重点还是要看谁的作业能力进展比较快。运动能力虽然比较博眼球,但对ToB(企业)客户来说,做demo、展示极限运动能力这些意义不是很大,他们关心的还是机器人的负载、速率、稳定性等等,能不能去完成工厂里一些复杂的、灵巧的,现在需要大量的工人去完成的事情比如苹果这种代工厂,全球有几十万工人,这对它们是巨大的负担。未来工厂可能每年都有削减5%-10%工人数量的指标要求,这就是具身智能第一阶段最大的需求方,去做这些传统工业自动化做不到的事情。

界面新闻:你觉得现在市面上的这些做机器人本体和小脑运动控制的公司,他们之间有很大壁垒吗?

姚卯青:我觉得确实不存在太高的壁垒。现在即使估值没那么高,人员没那么多的公司,做出的demo也完全不输一些大一些的公司。只要是1.3米左右的机器人,结合模仿学习和强化学习算法,完全可以去拍一拍demo视频。

界面新闻:那真正的壁垒在哪里呢?

姚卯青:真正的壁垒肯定在“manipulation”(操控)上,通过操作去完成任务。因为它要求的精度很高,是更加复杂的一套组合操作。走路这种能力其实是固定模式的重复运动,但去完成一个操作任务,涉及到跟物体的交互,还要深度规划、组合各种技能。在这个过程中,和机器人交互的物体也在随着作用力改变状态,机器人要去动态闭环地完成这个任务。

让机器人翻跟头,跳起来把自己扔到空中,其实只需要很短的时间,视频拍十次有一次成功就好了,这些都属于开环任务。但像倒水就是一个闭环的任务,机器人要决定什么时候要倒满了,什么时候该停下。

界面新闻:那想要完成操控的部分,背后需要做一些什么事情?

姚卯青:需要采集大量的数据。在采集过程中,一是要学会这种物理规律,二是学会操作时候的接触位置,三是要学会操作的技术。

我们认为,采集到一亿条数据以后,机器人应该可以达到Chat GPT3的智商。去年我们的数采工厂采集了100万数据,今年希望能够有1000万数据产出来。

界面新闻:数据采集的动作精细度要求也很高,耗时长。这样采下去的话,1亿条数据似乎遥遥无期。

姚卯青:其实也还好,因为进行数据采集的机器人数量还可以增大。如果用1000台机器人进行规模化采集,1亿条数据可能一年时间就能采够了。

界面新闻:机器人有Chat GPT3的智商是什么效果?

姚卯青:比如二指夹爪的机器人,可以做到对于常见的物品的抓放、摆布、推拉,操作一些常见设备,也可以和人做一些交互。人通过语言指令的形式,可以让机器人在环境中去理解、定位,完成相应动作。

界面新闻:具身智能的商业化什么时候能到来?

姚卯青:今年应该可以出现局部的一些商业化场景,包括我们内部就已经在做一些工业和商业场景

界面新闻:你也提到过,五年之后机器会进入家庭,这个五年是怎么估算的?

姚卯青:一个是数据量,我觉得五年就能收集得差不多。另一个是回过头看大语言模型的话,从2020年左右GPT 2让大家有了耳目一新的感觉之后,到现在成为一个成熟的产品,甚至现在一些agent能调用各种应用帮你完成任务,这个周期是五年。那类比到机器人,现在它开始蹒跚学步可以去颤颤巍巍帮你抓一些东西,已经是一种初期端到端的系统了,而不是写规则,用模块化的方法搞感知规控,技术的发展会不断加速,我觉得五年的时间是可以畅想一下的

从demo到量产,管好一万多个零件的供应链

界面新闻:你刚才提到机器人和大模型不一样,最终还是要拼制造。现在很多具身智能公司都选择自己做工厂、做供应链,建工厂这件事难在哪里呢?

姚卯青:你要管好机器人的这一万多个零件。首先供应链管理不仅仅是说砍价的能力,虽然砍价也重要,但你没有量,人家都不会搭理你,不会去给你做定制。其次要保证质量,造1000台机器人,做到一致其实是很难的。因为机器人的控制最主要就是在一些动力参数,像螺丝和结构件这种零部件有误差,就会严重影响到动力学模型。还有可靠性,能保证终生寿命维持在几万小时,或者核心零部件能保证十万小时、一百万小时的运行。

我们在做的时候,前期其实踩了很多这方面的坑。你以为这些参数设定好了,找人打样就行,以为是和汽车一样有很成熟的供应链,最后发现这些供应商都太初期了,经常干着干着都想自己来做,但作为一个小公司,其实不应该什么都自己做,还是要带着他们成长。

界面新闻:智元现在自己干的部分能有多少呢?

姚卯青:核心的关节,还有电路板这些硬件我们会自己设计,剩下我们更多想做系统的方案设计和集成。

界面新闻:智元前几天已经开了第一届供应商大会,这对一个初创公司来说也不是很常见。

姚卯青:确实现在已经用到了上百个供应商,我们需要通过供应商大会总结一下过去一年的量产成果和成绩,更重要是对齐我们今年更大的目标,让他们提前在质量和产能的规划上能够跟上我们。

界面新闻:今年的目标是什么?

姚卯青:我们自己的规划是今年有数千台机器人量产下线,应该是全球来讲最大数量了我们的优势就在比别人量产的早一些,早踩过一些坑。在量产规模比较大的情况下,对供应链才有真正的掌控能力。一方面量大了在开模这些成本上可以分摊,控制成本,另一方面也有更大话语权,对各种工艺、测试、质量标准都能提出自己的规范。

更快的创业节奏下,淘汰赛即将开启

界面新闻:我们谈具身智能经常会谈到两个其他行业——大模型,还有自动驾驶。你觉得和这两个行业相比,具身智能的创业节奏有明显加快吗?比如市场会很早就要求看到商业化的结果。

姚卯青:确实有感觉到。大模型大家搞了一年才发现不能商业闭环,对具身智能就会有一些杯弓蛇影的情况。和自动驾驶那时候比的话,因为10年前有美元基金,还是存在耐心资本的,现在就少一些。

界面新闻:你会担心具身智能也像自动驾驶一样,刚开始期望很高,但发展了10年也没能大规模落地吗?

姚卯青:技术的发展肯定是有不确定性,说不担心是假的。今天没有人敢说五年后机器人就和人一样,什么都会、什么都懂,运控和操作能力做的都很完美。但我相信在一些细分领域,它一定比自动驾驶有更大的机会去先实现商业落地本质上还是因为车是一个功能已经被定义好的明确形态,对安全性和效率的要求非常高,但机器人的应用场景更广,总能找到一些适合的场景先落地。

界面新闻:整体创业节奏的加快会对企业带来一些压力吗?

姚卯青:肯定是会的。所以明显能感觉到中国的具身智能公司和美国是很不一样的氛围。美国头部公司可以不断去融资、做研究,完全不想商业化的事,按照OpenAI的路径走。OpenAI这种烧了这么多钱,还没有盈利的公司在当下的创业环境中是很难存活下来的。

界面新闻:中美之间具身智能公司在估值上也有差距吗?

姚卯青:中国美国差太多了。我们的能力应该和美国头部的人形机器人团队相当,但在硅谷的估值体系下,美国公司的估值确实比国内高很多。

界面新闻:你会不会觉得大家对中国公司的要求太高,又太卷了?

姚卯青:中国公司就是太卷了。

界面新闻:认为未来中美在具身智能赛道上会是怎样的竞争关系?

姚卯青:我觉得一定是中国公司胜出因为机器人就是一个硬件制造业,你看新能源汽车、无人机现在已经没有美国什么事情了这个只是历史的反复上演而已而且美国的制造业是越来越弱的,加上中国的产业链和高素质的工程师学者越来越多,这是一个此消彼长、差距越来越大的一个过程。

界面新闻:你们怎么看这个大厂未来可能下场做具身智能这件事情?特别是腾讯也投了你们,上汽、比亚迪都在投你们,未来会不会被他们收购?

姚卯青:收购肯定不可能的,在中国这个市场里面不存在估值100 多亿公司被收购我们肯定是要去上市,但上市不是我们的终极目的,是为了支撑我们实现我们的长期愿景。大厂来做机器人的话,和大模型不同,大的互联网公司不太会做硬件,包括字节也明确说自己不会去看硬件这些重资产的东西。

未来我觉得具身智能赛道肯定也不会只有我们一家活下来,但是估计现在这么多创业公司也就会剩下两三家,因为主流的资本都已经站队了,新出来的创业项目持续融资的难度会大不少。

界面新闻:这意味着现在具身智能赛道开始进入一个冷静期了吗?

姚卯青:肯定是开始会进入收敛,然后一些同质化的公司拿钱就会越来越,或者只能拿个一轮两轮到后面大家如果没有差异化东西出来,也没有量产或者商业化闭环,慢慢就会开始淘汰了

界面新闻:你觉得是软件还是硬件的企业会活得更长一些?

姚卯青:我觉得号称做大脑的公司应该比较困难一些因为一这个耗钱,二它这个东西很难去商业化做硬件的话投入稍微小一点,跟跑可能还能坚持的时间久一点历史上也不乏跟跑然后能跟上的例子。但一个公司如果只是做一米三的机器人,只做运动控制,那应用场景确实会比较有限。

界面新闻:所以觉得智元是一个领跑的位置。

姚卯青:是的

界面新闻:最近智元也宣布了很多合作,包括和阶跃星辰还有Physical Intelligence,在合作这件事情上是怎么看的?

姚卯青:我们是很开放的,不会担心合作方我们将来产生商业上的一些竞争和冲突,更多是我们希望去利用他们一些已有的能力来为我们的行业做赋能。比如阶跃用几万张卡训练出基础模型,我们就没有必要从头再干一遍,那就看能不能利用它的多模态模型来赋能我们机器人的大脑。

像Pi的话,具身智能的算法本身还远远没有到终局,必须要以开放的心态跟进现在最主流的一些方向,和最有可能成为将来头部玩家的一些人去组建一个好的生态。将来其实我们并不排斥说有一个特别好的算法大脑,我们去预装到我们的机器上去卖给用户,这也是一个好的模式。

转载请注明来自济南华森老年公寓,本文标题:《对话智元合伙人姚卯青:具身智能淘汰赛即将开启》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,35人围观)参与讨论

还没有评论,来说两句吧...