用大白话讲一下人形机器人背后的大棋

时间: 2025-03-31 21:33:00 |   作者: od体育在线登陆

  

用大白话讲一下人形机器人背后的大棋

  击败它的,是一台来自深圳的“众擎机器人”——丝滑流畅的斧头帮舞蹈过于完美,以至于让很多质疑中国科技发展水平的人表示这肯定是CG合成或者AI生成。

  他们不得不面对这样的一个艰难的选择:要么承认中国机器人技术先进,要么承认中国AI技术先进,要么承认中国CG制作先进。

  后来为了应对这些质疑,众擎专门拿出了第三视角的录像画面和训练花絮。结果却更令人感到惊艳——众擎的这款机器人对舞蹈动作的学习,似乎并不是依靠手动输入的程序指令,而是像人类一样,一边看着舞蹈老师的示范,一边自己模仿。

  实际上,从2024年底开始,中国的机器人企业便开始了密集的新款机器人产品的宣发——云深处的轮足机器狗可以在崎岖的南方山地中随意穿梭,“华为天才少年”彭志晖的智元机器人慢慢的开始在进行家务劳动训练。

  不过,人家宇树也没闲着,你们爱怎么跳舞就怎么跳舞,人家一个机器人侧空翻视频,就又一次证明了自己的实力——这动作对于机器人的动作算法、机械性能、平衡能力的要求是相当高的。

  虽然2025年到现在才过去了不到三个月,但再往后的九个月时间里,关于机器人的新闻一定不会少。

  更细思极恐的是:这一切,其实都已经被计划好了——早在2021年12月的《“十四五”机器人产业高质量发展规划》里就已经提出了“到2025年,我国要成为全世界机器人技术创新策源地”,在2023年工信部的《人形机器人创新发展指导意见》中,也提出“到2025年,人形机器人创新体系初步建立,“大脑”“小脑”“肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。”

  不要低估了“颠覆性产品”这个词,虽然最近这几年,“颠覆性产品”这个词已经被很多企业给玩儿坏了,搞得随便什么一个产品的发布会都要说几声“颠覆”、道几句“炸裂”,好像不用这些大词就不足以表达产品的先进一样。

  但是,在严谨且克制的官方话语体系中,“颠覆性产品”这个词的含金量并没有打丝毫折扣——在2023年的那份,《人形机器人创新发展指导意见》中工信部一共列出了四类“颠覆性产品”——前三个分别是电脑、智能手机、新能源汽车,第四个就是人形机器人。

  官方口径里的“颠覆性产品”,那就一定是颠覆性的产品。因为想达到工信部的“颠覆性产品”标准,要求是相当高的,从电脑、智能手机、新能源汽车的发展历史来看,它们无一例外都满足以下三条标准:

  言下之意就是:这款产品的普及程度一定极高、销量一定极为巨大,高到社会上大多数人都会用到,否则谈不上深刻改变整个社会。而超高的销量,也就从另一方面代表着背后有漫长的产业链,不仅是几个龙头集成商的事儿,更是背后成百上千家供应商的事业。

  回想一下电脑、智能手机、新能源汽车这些年带来的变化,我们就可以感觉到工信部所说“颠覆性产品”的含金量——人形机器人是一个能培育出像华为、小米、比亚迪这样的超级大厂的赛道,是一个能让现在本就如日中天的大厂们更上一个台阶的赛道,是一个能够养活包括软件、硬件、应用在内各种配套产业的赛道

  也只有这样的赛道,才配得上“科技竞争新高地、未来产业新赛道、经济发展新引擎”的描述。

  “人形”的真正含义是:不论在工业生产场景还是在日常生活场景,都能提供超强的通用性。

  以工业生产场景为例,人形机器人几乎是实现“人机一体化智能系统”“柔性制造”的必要条件。

  假设你现在有一个生产筷子的工厂,生产工序的最后一步就是把十根筷子塞进一个圆筒里并拧上盖子。

  如果是人工操作,那么这道工序就很容易——点出来十根筷子、一把抓起、在桌面上怼一下对齐、塞进圆筒、拧好盖子——这就是人工操作的优势,简单直白、清楚明确,干就完了。

  不过,虽然人类的动作兼具了简洁和高效,但人类实在太脆弱了——“整理筷子”这一个动作,做一次两次不算个事儿,那如果要做1000次2000次呢,要是每天连续不停做好几个小时呢?人类的小胳膊小腿儿,还能扛住吗?

  自动化流水线的优势很好理解。它是机器,可以24小时不间断运行,不知疲倦,而且速度比人类快得多。但劣势则在于,它是“二维”的——一个人类可以轻轻松松完成的动作,机器想做到往往需要拆分为多个步骤。

  还是以“整理筷子”为例,一个自动化流水线想完成这个在人类看来格外的简单的动作在大多数情况下要如下流程:

  虽然一个动作拆成好几个步骤看上去不怎么优雅,但这样做的效率也可以很高。只是,这种把“简单的事情变复杂”的行为却有一个相当大的弊端——自动化流水线是高度定制化的,整理筷子的流水线是没办法用在整理盘子上的,想用来生产新产品,很多时候就要重新设计、建造生产线。

  说到底,传统的自动流水线,它还是“结构化”的——哪怕现在有不少公司制作的“柔性制造”能力很强,本质上也不过就是把好几套动作、好几种硬件融合在一起而已。

  写到这里,我们就能知道“人形机器人”的价值了。因为人形,所以它的动作也是三维的、是不需要展开成为多个二维动作的——面对生产不一样产品的任务,人形机器人只需要在软件层面改变动作方式即可,不需要像传统自动流水线那样完全另起炉灶。

  理论上来说,只要算法、硬件足够强大,人形机器人就能做到和人一样的灵活——别看它现在没学几种姿势,但它身段足够灵活,以后总是能学会的。

  传统自动流水线的建设流程是相当长的,非标自动化这个行业主打的就是一个卷,你得亲身去工厂和工厂老板谈,知道人家到底想要的是什么,然后展开设计、建造、调试,后期还有维护和修理在等着你......总之整个周期可以说是相当长,也相当死板。

  而且传统自动流水线的设计往往也都是“一次性”的,很多流水线在设计的时候没什么模块化的概念,遇到升级改造就得推翻重来,旧有设计不能重复使用,设计成本和出错的概率大大增加。

  最终结果就是:一旦市场有变,需要在产品上加点什么新功能、新部件,那原来设计好的东西很可能就废了。

  以杭州某企业为例,2023年底的时候,这家企业曾经开发过一种AI摄像机。本来风平浪静的,结果正好迎头赶上了AI行业火爆,市场对AI算力的需求提高,产品的性能需要翻倍。但遗憾的是,这家企业的生产线依旧是传统的自动流水线,改造时间极为漫长,企业不得不推迟发布时间,被对手抢了先机,原本的市场占有率丢了许多。

  而如果是成熟的人形机器人,这种事情就很好处理——因为三维的人形机器人是没必要展开那么多二维动作的,改造生产线的必要性也就没那么高。

  甚至,对于人形机器人来说,生产流程改造什么的,很大程度上在软件层面上就能解决——几个程序员就能搞定的事儿,没必要停机。

  基于上述种种优势,我们有理由认为:对于未来的制造业而言,人形机器人是必不可少的一环。

  说“不赚钱”其实有点不全面,现在靠人形机器人赚钱的路子倒也有,只是匹配不了这么高的价值——在当下此阶段,出租机器人,让这些机器人去参加展览、演出、当吉祥物,远比让他们进工厂打螺丝赚得多——官方定价9.9万元的宇树G1机器人,在二手交易买卖平台的租赁价格最高一度达到每天1.5万元,目前依旧稳定在8000元左右,并且供不应求。

  某种程度上,这种“提供情绪价值”的吉祥物表演阶段也是机器人发展的必经之路了——1973年日本早稻田大学就已经开发出了全尺寸的人形机器人Wabot-1,本田也在1986年开始研发机器人的双足结构,后期更是推出了Asimo机器人。日本人虽然起了个大早,但最终也没有攻克成本问题——Asimo的租金每年高达2000万日元,提供情绪价值都太贵了,只能让本田自己放在展会上秀一下肌肉。

  而后面波士顿动力的阿特拉斯、特斯拉的擎天柱是相同,虽然技术上都有不小突破,但连大规模商用的边都摸不到。

  对于人形机器人来说,其发展规律一定是先进厂打工,再到寻常百姓家里干活儿。原因很简单,1000万砸在工厂里很多时候也就是听个响,甚至不够建一条产线,但对消费的人来说这就是天文数字。而且工业场景比起家里还是简单、单调太多了,短期内更适合还没有进化到完全体的人形机器人发挥作用。

  一家工厂购买机器人,大概率是要求人形机器人的购买、折旧、维护等综合成本小于雇佣人类工人。但当下人形机器人的价格比起用工成本还是太高了——能上产线的机器人,价格在几十万到数百万,不把这样的价格打下来,机器人进厂打工就只能存在于PPT上。

  2013年波士顿动力的阿特拉斯就已经在机械性能上做到了相当高的程度,足以完成许多高难度动作。但在软件层上,阿特拉斯只能根据预先设定的“行为库”里的动作进行运动。

  阻挡阿特拉斯更进一步的,表面上看是动作的灵活与丰富,本质上其实是数据和算法——人形机器人想要学会和人一样做事情,数据和算法是很重要的。我们能看到的是机器人在前台的表演,看不到的是背后的数据和训练。

  随便一个简单的动作,哪怕只是捡起一个东西,背后就需要采集上百条高质量的数据。如果想让机器人在工厂里发挥作用,那数据条数是千亿起步。

  以特斯拉的Optimus(擎天柱)机器人训练为例——为了训练它,特斯拉专门聘请了几十位动作捕捉人员,要求他们每天都要走七个小时,以保证能给机器人喂足够多的数据。但这其实远远不足,因为如果想让机器人能在工厂里干活儿,训练数据的时长在百万小时,总成本五亿美元起步且不保证100%成功。

  要注意,这还只是机器人厂商自己组织的训练,某一些程度上只能说是“基础课”。而最终投入实用,不同工厂、不同岗位的行动自然也不同,机器人还得在补修“专业课”。而更进阶的“专业课”学费,那就要购买机器人的工厂来自己支付了。

  不难想象,面对现阶段如此高昂的机器人训练成本,工厂们大概率是不愿意买单的。

  毕竟,人形机器人的自动控制可比无人驾驶难太多了,不仅需要仔细考虑水平面上的运动轨迹,还需要仔细考虑三维空间里的物体运动。如果只是依靠人类的遥控和动作捕捉,根本就没办法提供足够的数据。

  谷歌当初在一个厨房的场景里死磕了17个月,最后也就采集了13万条数据,机器人在这个熟悉的环境里表现得很优秀,但只要换个环境,立刻就了——成功率从97%暴跌到了30%。

  所以,对于当前阶段人形机器人的发展来说,最急需解决的就是训练成本问题——怎么样找到一种高效的训练方法,使得人形机器人能低成本、快速掌握岗位所需的诸多技能。

  人形机器人的核心系统,有可能可以分成“大脑”“小脑”“肢体”三部分,“大脑”负责的是让机器人理解指令、规划行动;“小脑”负责根据规划控制动作;“肢体”则是各种机械结构来具体执行动作。

  或者,你也可以把大脑小脑统一归结为上半身,肢体运动什么的统一归结为下半身。

  宇树、众擎这些新锐的机器人企业,有一个算一个,其实研究的都是“下半身”。而真正能让机器人发挥出强大威力的,还得是“上半身”。

  而不论是“大脑”“小脑”,其实最后归根结底,都还是要靠AI实现的——这恰恰就是中国科技公司的优势领域了。

  实际上,中国的科技公司,从阿里、腾讯到京东、美团,从华为、小米到大疆、比亚迪、塞力斯......有一个算一个,都已经在布局人形机器人了,区别只在于具体以什么样的形式进行布局。

  像阿里、百度、腾讯这些大公司,虽然都开始布局这样的领域,但基本上没有自己动手造机器人的身体,而是更愿意掏钱投资相关企业,或者利用自己擅长的数据技术,专门研究机器人的大脑——也就是那些复杂的算法和模型。

  说白了,这些网络公司更看重的是机器人的软件部分,而不是硬件部分。他们都觉得,与其费劲去造机器人的外壳和零件,不如专注于让机器人变得更聪明、更智能。这些网络公司现在就开始布局,为未来做准备。不过,他们的做法更像是幕后军师,而不是前线战士。

  不过,值得一提的是,当前互联网巨头们在人形机器人领域的目光其实是聚焦于通用的大模型上。现在技术还不能让机器人像人类一样直接感知周围环境并自主做出决策和行动,它们更多是依赖外部设备来获取信息。

  国内几大网络公司,比如百度、阿里、腾讯,都推出了自己的多模态大模型,比如百度的“文心”、阿里的“通义”、腾讯的“混元”。这些模型虽然能处理多种类型的数据,但还做不到让机器人“活”起来,真正与环境互动。

  不过,国内企业也在努力向“具身智能”方向发展,也就是让机器人拥有更接近人类的感知和行动能力。

  以字节为例,字节跳动在机器人领域的探索从2020年就开始了,他们利用自己在互联网行业积累的数据优势,开发了各种大模型。2024年,字节还发布了GR-2具身大模型——GR-2具身大模型的亮点在于它像婴儿一样学习复杂任务。

  预训练阶段,它“观看”了3800万个互联网视频和500亿个tokens,涵盖家庭、户外等场景,具备多任务学习和环境适应能力。微调阶段,通过机器人轨迹优化视频生成和动作预测,展现出强大的多任务学习能力,在100多个任务中平均成功率高达97.7%。

  阿里通过“通义千问”大模型成功将AI技术应用于工业机器人,Qwen2系列模型开源后下载量超4000万,衍生模型达5万,并达成千万级商业订单。阿里积极投资AI大模型企业,覆盖月之暗面、MiniMax等头部项目。2024年5月,阿里通过“杭州灏月”增持人形机器人企业逐际动力,成为其第二大股东,强调技术落地与盈利性。

  小米则不走寻常路,自主研发人形机器人。2022年推出首款全栈仿生机器人Cyber One,标志着小米进军人形机器人领域。

  虽未量产,但Cyber One已逐步融入小米自有制造系统。2024年6月,小米机器人公司迁至亦庄工厂,Cyber One开始分阶段落地,向特斯拉那样的工业制造路线靠拢。

  2024年,车企纷纷进军人形机器人领域,广汽推出Go Mate,小鹏发布Iron,小米有Cyber One,奇瑞有Mornine,比亚迪有“尧舜禹”。就在这两天,靠着问界火起来的塞力斯也加入了战局,布局方式包括但不限于投资(如吉利)、自研(小鹏、小米、广汽)和合作开发(奇瑞)。

  其实这也很好理解,车企在人形机器人领域具有天然优势,因其与无人驾驶技术相似,涉及“感知+决策+执行”。AI芯片、电机、传感器等技术可直接复用,自有工厂则为机器人落地提供了理想场景。跨界角逐已成必然趋势。

  就在今天,3月26日,一汽奥迪宣布国产机器人开始进厂打工,vivo也官宣成立机器人实验室。

  总而言之就是,人形机器人已经成功勾引到了中国几乎所有上台面的大型科技企业。

  日本虽然是最先开始人形机器人探索的国家,但很遗憾,日本的人形机器人从始至终就没有和智能化沾边——因为日本人没有点亮互联网和AI的科技树,只能在机电领域死磕。

  但中美两国则不同,互联网、AI都是中美两国的优势领域,所以人形机器人最终的竞争,也一定是中美两国企业之间的对轰。

  美国那边有波士顿动力、有特斯拉、有FigureAI,我们这边有宇树、智元、众擎、优必选......实际上,全球150多家机器人企业,超过80家都在国内,剩下的70几家不用想,基本也在北美了。

  今年往后的几个月,中美两国的人形机器人企业一定都会整出来各种狠活儿,因为融资规模摆在这,各路资本都慢慢的开始投资人形机器人了。

  在我看来,中国一定会率先在人形机器人上做出实质性的突破——原因无他,因为论起工业数据,论起工业场景,谁又能和世界第一工业国一较高下呢?

  任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。返回搜狐,查看更加多

返回产品列表