中国机械人,,,起头给模型上强度
岁首,,,驰名机械人行业媒体The Robot Report在2026年行业瞻望中指出,,,中国正与美国并驾齐驱引领物理AI的发展,,,其与美国公司差距化的模型规划将推动人形机械人部署[1]。。
两个月后,,,美中经济与安全审查委员会(USCC)颁布汇报称,,,中国已经进一步提升了顶尖模型的机能。。“中国推动AI技术在机械人等领域的宽泛利用,,,由此产生的真实数据为模型的改进提供了支持[2]。。”
这是西方媒体与机构针对中国人形机械人产业可贵的集体改口。。
西方语境之下的中国,,,惯常以“强制作”形象示人,,,即便承包了全球大部门人形机械人出货量,,,被反复提及的仍是硬件出产能力、、供给链、、效能和性价比,,,“硬件靠中国,,,模型靠美国”成为一种政治正确。。
然而,,,随着人形机械人进入大规模落地期,,,中国机械人公司的模型实力起头被重新审视。。
本月,,,具身智能领军企业它石智航颁发实现4.55亿美金Pre-A轮融资,,,创下中国具身智能史上最高单轮融资纪录和最大Pre-A轮融资纪录,,,成立首年累计公开融资达到6.97亿美金,,,这个数字,,,是当下行业领头羊、、全球估值最高的机械人企业——Figure AI首年融资额的近10倍。。
与主打跳舞打拳大部门中国人形机械人的分歧,,,它石机械人出圈,,,靠的是能突破世界纪录的模型能力,,,这正是本钱蜂拥而至的原因地点。。
它石的出现,,,再次印证了中国人形机械人产业正在产生的新态势:::硬件强,,,模型要更强。。
新的蹊径
功夫拉回到一年前的特斯拉电话会议,,,马斯克先扬后抑,,,夸完自家Optimus世界第一,,,再提“中国威胁论”:::不铺排名第二到第十的人形机械人公司满是中国的[3]。。
综合马斯克全场讲话,,,这句话隐含两层意思,,,一是中国公司能够靠壮大的硬件制作能力占据人形机械人大部门市场,,,二是即便如此,,,中国公司依然打不外特斯拉。。
给马斯克信心的,,,是美国在模型上的绝对实力。。
平心而论,,,从VLA再到世界模型,,,美国始终把握着模型最前沿的演进方向,,,因而无论硬件制作多拉垮,,,美国机械人总被以为能够通过更聪明的“大脑”对中国机械人降维进攻。。
现实上,,,硬件和模型是人形机械人的“两条腿”,,,两者的进取缺一不成。。
人形机械人区别于传统工业机械人的关键是泛化和通用性,,,不只有像人一样有手有脚,,,还得像人一样既能打螺丝,,,又能洗衣做饭煮咖啡,,,硬件决定行动力,,,模型决定通用性。。
梦想中的人形机械人既能进厂打工又能在家做家务
硬件的镣铐在于大部门零部件必须“无中生有”,,,纯靠厂商“现搓”,,,这是中国零部件制作商善于的,,,所以中国机械人“表演欲”旺盛,,,其实是为了秀硬件的肌肉。。
模型的瓶颈在于路线尚未收敛,,,训练还需功夫,,,模型入端降本仍是考验,,,这是美国科学家的传统艺能,,,所以美国的机械人公司总把产品颁布会开成学术颁发会。。
对于大部门中国机械人公司来说,,,当下,,,模型瘸腿带来的贸易化困境已经起头显露,,,中国机械人被诟病只跳舞不打工,,,不是主观上不愿意,,,而是客观上“脑子”还不够聪明。。
人形机械人模型的主流技术路线能够分为三种:::
第一种是以特斯拉为代表的自动驾驶迁徙路线,,,主题是将自动驾驶能力“平移”到机械人身上,,,例如特斯拉直接复用其FSD视觉算法和占用网络(Occupancy Network),,,让机械人占有类似汽车的3D空间建模能力;;;
Optimus照搬特斯拉的FSD模型
第二种是以Figure AI的Helix系统为代表的VLA端到端路线,,,主张将机械人的感知、、思虑与行动集成在统一个大模型中,,,搭载这类模型的机械人具备极强的学问推理能力,,,好比对它说“我饿了”,,,它就会直接找食品并递给你。。
第三种是很多主流中国机械人公司都在用的“大脑+小脑模式”,,,“大脑”用大说话或视觉模型来拆解工作,,,“小脑”用强化学习或传统节制理论来做工作。。
前两种蹊径技术被产业寄托厚望,,,但在现实操作中弊端比利益更凸起。。
例如特斯拉的“平移”路线必要大量的适配与再验证工作,,,具身智能比自动驾驶要复杂若干数量级,,,模型无法直接合用,,,导致Optimus量产一拖再拖,,,且据称目前只能做搬运、、装配等单一操作,,,距离真正代替人类工人生怕还得再等等。。
Figure AI的VLA路线硬伤在于“作为跟不上大脑”。。固然“善解人意”(推理能力强),,,但到了产线上,,,也由于推理延长,,,无法实现亚毫米级的精密化实时反馈,,,干不了细活。。
再加上极其依赖特定场景的预训练视频,,,工厂环境、、光照甚至零件色差产生细小变动,,,容易产生“逻辑死机”,,,而真实产业场景刚好复杂、、多变、、容错率低,,,跨产线工作的通用泛化能力与不变工作能力造就难度极大,,,因而短功夫还很难在复杂的工业实战中落地。。
国内主流的“大脑+小脑”路线则是先天不及,,,“大脑”和“小脑”的割裂导致无法实现高精度操作,,,是大部门中国机械人无法进场拧螺丝的重要原因。。
中美双方,,,一个开发硬件,,,一个钻研模型,,,看似两条腿齐步走,,,现实情况却是模型远远跟不上硬件的发展速度。。傍边国供给链已经起头下探硬件成本,,,模型的进取还仅仅停顿在和论文和PPT里,,,扼住了贸易化的喉咙。。
中美双方暗暗都在等待和竞争一个新的蹊径出现。。这次是中国先出了招。。
数据为王
3月进行的全球三各人电及消费电子展之一AWE,,,不负众望开成了人形机械人的秀场。。
与隔壁跳舞打拳的机械人相比,,,它石智航的展台显得很求实,,,机械人A1没什么花拳绣腿,,,但却以一小时百余次的速度,,,创制了“机械人在一小时内装配亚毫米级线束最屡次数”的吉尼斯世界纪录。。
吉尼斯世界纪录颁奖现场,,,A1机械人创制了吉尼斯世界纪录
这一幕的含金量,,,身处一线的自动化工程师和工人们肯定懂。。
线束分歧于刚性零件,,,会弯曲、、晃悠、、变形。;;;等吮匦朐诿恳缓撩胧凳备兄呤那嵛⒆刺涠⒆龀鲅呛撩准兜淖魑獬,,,被以为是工业自动化界的“哥德巴赫猜测”世界级难题。。
攻克线束装配,,,直接把它石A1与还在工厂做搬运分拣工作的机械人们拉开了差距,,,也把它石的模型能力放到了一个值得单独审视的地位。。
2025年2月才成立的它石出道不算早,,,但其在成立后的三个月内就实现了2.42亿美元天使轮融资,,,突破了中国具身智能有史以来的天使轮融资纪录。。
首创人兼CEO陈亦伦和董事长李震宇均为国内自动驾驶领武士物,,,名声在外;;;首席科学家丁文超和首席架构师陈同庆同样产业布景深厚,,,主导过众多驰名自动驾驶项目。。
自动驾驶被视为人形机械人的前置产业和子命题,,,因而技术团队的自动驾驶经验很大水平决定了技术的深度和广度,,,特斯拉最早的Optimus团队工程师大部门就是从汽车产业链跳槽来的。。
也正是这样的团队组合,,,使得它石在纷繁的技术蹊径和产业杂音中找到了突破口。。
它石提出的步骤是直接与真实世界对齐,,,创新打造“数据、、模型和物理硬件三位一体”解决规划,,,主题逻辑是以真实世界数据驱动研发世界模型。。这一蹊径在其时并不主流,,,甚至因作难度极大、、见效极慢,,,能够说是吃力不讨好,,,但却也是通向通用智能最“垂直”的一条蹊径。。
为此,,,它石初创了Human-centric数据采集新范式,,,可能实现真实世界具身数据获取能力的逾越式突破,,,精准锁定了当下行业痛点——数据。。
它石“三位一体”规划
模型训练,,,数据为王。;;;等嗣浅俪傥薹ńТ蚬,,,原因就在于用于其模型训练的数据规;;;共还淮,,,不够真实,,,也不够靠得住。。
相较于大说话模型能够依赖网络上现有的图文数据,,,机械人必要与真实的物理世界交互,,,必要大量“第一人称数据”,,,具体蕴含视觉感知数据、、活动节制数据、、物理反馈数据等。。
这些数据无法从网上获得,,,必要在真实场景中通过实操来获取、、堆集,,,是一个从0到1的工程。。
放眼全球,,,即便家大业大如特斯拉,,,除了生搬自驾数据,,,早期重要靠遥操作获取数据,,,人类操作员穿上特制设备,,,远程驱动机械人作为,,,机械人身上的传感器纪录力觉、、触觉、、空间感等各个维度数据,,,反复几千上万次,,,用以训练。。
通过人类操作员通过遥操作“教”机械人做作为
这种步骤不仅费人花钱,,,并且由于机械人机械结构的局限性,,,采集到的数据是人类“为了适应机械人”而变形的作为,,,导致训练出来的机械人作为流畅度远低于人类正常水平。。
Figure AI除了遥操作之外,,,还网络了大量人类第一视角视频,,,让机械人“边看边学”,,,但学习效能还得看机械人自身的智力水平,,,就像都是看网课学习,,,学霸和学渣的成效也分歧,,,并且只有视觉没有触觉。。
综合现有规划,,,不是成本高昂就是数据不够靠得住,,,而它石的Human-centric最大改进就是提高了数据网络的真实性和可操作性:::
人类操作员穿戴它石自研的SenseHub套件在真实场景中干活,,,由套件中的传感器纪录数据,,,如此纪录的是人类肢体最天然的加快度、、抓取力和空间轨迹,,,这些数据没有经过机械人硬件的“传染”,,,保留了作为的原生高频细节。。
其中SenseHub套件蕴含TARS Glove(高精度动捕手套)和 TARS Vision(第一视角感知相机),,,轻巧易穿戴,,,主打随时随地采集数据。。
人类操作员穿戴SenseHub套件做指定作为网络数据
由于不必要机械人共同,,,这种模式能够利用人海战术进行大规模并行采集,,,且成本大幅降落,,,凭据机构测算,,,其成本预估比传统的真机遥操作低10-20倍。。而在这一领域,,,中国刚好具备极大的先天优势,,,由于这里具备超大规模的利用场景与极高的工作多样性。。
通过提高数据的纯净度和数据采集的效能,,,它石Human-centric解决的是当下机械人行业普遍存在的贸易化“迟延症”,,,也为机械人的大规模落地提供了弯道超车的新蹊径。。
在上述数据范式下,,,它石收成的是实打实的模型成就与巨大的利用潜力。。
2026年3月,,,它石颁布的通用具身大模型AWE3.0在一连全身端到端学习、、动态时空推理等既有优势基础上,,,实现了三项关键性的技术创新:::全视角通感决策(OSD)、、高密度触觉感知(HTS)、、隐空间丝滑作为(LAS),,,它们可大幅提升机械人在新视角下的工作成功率、、对部门触觉的活络感知与精密响应能力,,,降低了工作抖动率。。
而世界级的纪录印证,,,也只是它石模型能力的一隅溢出。。
它石智航吉尼斯世界纪录挑战现场
渐进式 VS 逾越式
高新技术从开发到大规模落地,,,总要经历一个阵痛期,,,在分歧的技术蹊径之间反复试错,,,而后慢慢靠近贸易化发作的奇点。。
人形机械人正在经历的就是这样的阵痛期,,,技术蹊径尚未收敛,,,每一条看似光明的大路前方实则大雾弥漫。。这个阶段,,,考验的与其说是谁的技术路线更高级,,,不如说是谁更能接受住试错的风险,,,在世走到大雾飘散的时刻。。
上一个接受考验的是人形机械人的“前辈”,,,自动驾驶汽车。。
与当前人形机械人厂商繁芜的技术路线类似,,,最早一批自动驾驶开发者,,,同样面对几条分歧的发展蹊径,,,最具代表性的是“逾越式”和“渐进式”。。
”逾越式”优等生如Waymo、、Cruise,,,主题逻辑是直接研发L4级自动驾驶,,,不依赖人类监管,,,在特定区域进行贸易化测试;;;“渐进式”代表如特斯拉、、小鹏,,,主题逻辑是先量产L2/L2+,,,再利用海量用户行驶数据反哺算法,,,逐步提升自动化等级。。
这种直捣黄龙的激进路线,,,最初是大部门参加者的选择,,,但其时开发出来的L4车辆成本高达20万美元,,,并且由于测试周期漫长,,,导致贸易化举步维艰,,,企业重资产运营、、负债前行。。
与之对应的是“渐进式”主打“先上路、、再进取”,,,最典型的代表就是特斯拉,,,其主题逻辑是先实现L2/L2+自动驾驶,,,再逐步提升自动化等级。。性质是保障了能活下来,,,再在技术循序渐进,,,通过真实的驾驶数据、、解决一个个corner case,,,进而反哺模型能力。。
从前的几年,,,逾越式的行列随时有人倒下,,,逐步人丁稀少,,,反倒是渐进式的行列不休壮大,,,大模型时期来临,,,特斯拉也是最早调转船头、、吃到大模型盈利的车企。。
如今的人形机械人,,,类似逾越式和渐进式之争已经露出苗头。。
Figure AI的技术路线就类似于逾越式,,,即一路头就追求通用化的极致、、全场景的覆盖。。
Figure AI试图让机械人通过“看视频”自学,,,相当于让自动驾驶汽车上来就齐全脱节高精地图、、纯靠算法感知世界。。小学生不是不能做大学高数题,,,但前提是小学生是个万里挑一的天才。。
但人形机械人必要的不只是智商,,,还有“行动力”,,,博士生进厂打工可能不如一个高中毕业的纯熟工,,,没有足够的真实、、精准针对特定场景且有效数据的堆集,,,机械人再聪明,,,也拧不了一颗螺丝钉。。
这种情况下,,,量产无期限迟延或是现实能力不切合预期也未可厚非,,,但投资人的钱总有烧干的一天,,,要比及技术美满再大规模量产,,,或许率会步入自动驾驶“逾越式先烈”的后尘。。
它石走的就是类似于“渐进式”的路线,,,即先从特定场景启程,,,先学会人类最精密的作为,,,再谈泛化,,,解决规划萦绕“效能至上、、落地利用为先”的战术。。
Human-centric的最大突破就是脱节了“先造出高精度的机械人、、再采集数据”的镣铐,,,通过自研SenseHub套件,,,人类操作员能够随时在产线上作业采集数据,,,使得其大模型可能急剧进化更新,,,与硬件共同进取,,,构建起一个相互赋能的闭环,,,进而急剧跑通具身智能的scaling law。。
它石A1机械人产线多机协同
同时,,,数采成本降低至遥操作的1/10到1/20,,,意味着一致本钱投入,,,可能覆盖的场景深度(如从单一的抓取到复杂的精密装配)和广度是竞争敌手的数十倍。。
这种贸易和技术的平衡,,,使得它石可能保障技术持续提升的同时,,,确保量产和贸易化的节拍,,,实时“造血输血”,,,这也是为什么机械人公司扎堆,,,“来得晚”的它石反而获得本钱的青睐。。
活下去,,,其实是每个科技创业公司最稀缺、、也是最贵重的能力。。
它石的Pre-A融资,,,是高瓴本钱与红杉中国两大顶级本钱初次在具身智能赛道结合领投,,,本轮后它石已然跻身国内人形机械人的第一梯队。。
但这远未达到它石的巅峰。。
将视线拉向全球,,,中美机械人公司估值的天堑不言而喻:::Figure AI背靠OpenAI,,,短短两年内身价突破390亿美元(约合人民币2700多亿元);;;特斯拉Optimus量产日程一拖再拖,,,也不故障本钱将其隐形估值锚定在千亿美元高低。。
这种落差并非技术的代差,,,而是刻板印象的投资语境下,,,本钱与技术实力的错配。。
当顶着光环的明星企业还在为若何走出尝试室、、克服落地延长而焦虑时,,,它石已经靠着更低的数据成本、、更大的数据规模、、更真实的物理世界数据和更精准求实的模型,,,在工业落地的深水区实现终部门战场的技术反超。。
某种意思上,,,如今的它石正伫立于极具性价比的发作前夕。。随着其机械人在真实产线上展示出越来越壮大的韧性,,,眼下的估值天堑终将被填平,,,同时迎来价值的真正重估。。
写在最后
今年岁首的特斯拉电话会议,,,马斯克须生常谈,,,再次对中国人形机械人公司大夸特夸,,,而这次夸的不只是中国的硬件,,,还称中国的模型“也相当不错”。。
看着中国人形机械人在模型端的超预期进取,,,美国的“特斯拉们”的确该严重了。。
[1] Chinese robotics outlook 2026,,,The Robot Report
[2] China’s open-source dominance threatens US AI lead, US advisory body warns, Rueters
[3] Elon Musk worries Chinese companies will fill out the world’s top 10 robot makers—but claims Tesla is, and will stay, No. 1,,,Fortune
[4] 中国机械人在跳舞,,,美国机械人在发论文,,,远川科技评论
文章点评
未查问到任何数据!
颁发评论
◎欢迎参加会商,,,请在这里颁发您的见解、、互换您的概念。。