1939年,在纽约世界博览会上,有一台身高2.1米,体重118公斤的机器人Elektro亮相。机器人不仅会说话、走路,甚至还会抽烟等26种技能,并宣称具有700个单词的词汇量。
在那个第一台黑白电视机在美国初初面世、距离后世著名的“图灵测试”问世仍有11年的年代,这样酷炫的产品自然引起了世界范围的关注。一时间,Elektro风头无两,上电视、演电影、到各地巡回演出,甚至拥有了自己的机械狗Sparko。
以当下的技术眼光看,Elektro这些所谓的“技能”其实更多是噱头——所谓的“走路”,依靠的是轮子和轨道;与操作员的“对话”,则是通过预先设计好的特殊音节代码实现;而别具特色的“抽烟”,则是靠助手把烟塞进它上嘴唇的洞中并点燃。
(资料图片仅供参考)
高调亮相的背后,却是,普通的落地。
而这一幕与当下人形机器人们的处境也何其相似:本田的Asimo表演踢足球,波士顿动力的Atlas能后空翻,小米的“铁大”在发布会上给雷军献花后还学起了敲架子鼓。人们充满惊奇地欣赏完舞台秀之后,却在商业应用方向感叹:就这?
80年过去了,人们对机器人的想象早已不是这样“形”上的模仿,而是期待一款真正能成为劳动力替代的全能型产品,并且要经济实惠到足以从实验室走进生产线,切实在某个应用场景中发挥效用。那在供需天平的另一端,制造机器人的企业,围绕"人形"做文章已久,又是否真正努力过实现机器代人?
据此,本文将回顾走在技术研发前线的两款机器人,Asimo与Atlas的艰难产业化进程,盘点当下最火“擎天柱”Optimus的技术亮点,以此展望:人形机器人,商业化路在何方?
1还没有一家人形机器人公司能实现商业化
人形机器人发展至今,已经见得了总统,上得了春晚,当得了男团,功能酷炫上天,但在商业上还是难以落地。本田Asimo、软银Pepper均已经停产,波士顿动力Atlas、特斯拉Optimus也还尚处于实验室阶段。为何产业化那么难?就拿人们最期待的本田Asimo和波士顿动力Atlas来说一说。
“时代先驱”本田Asimo ,Born in 2000
从高达和新世界福音战士等一系列日本动漫可以看出,似乎日本对于人形机器人有一种与生俱来的执念,而浓厚的机器人产业底蕴以及良好的经济基础,也给这个时期的日本研发人形机器人提供了良好的环境。
自 1967 年起,日本人就在仿人机器人领域孤独地前行了半个世纪。而本田的ASIMO ,被认为是致敬著名科幻作家阿西莫夫Asimov,它作为全球最早实现双足行走能力的机器人,代表了日本人形机器人的最高成就。
持续半世纪的孤独前行
Asimo前前后后迭代了6个版本。第一阶段1986年至1993年,主要攻克机器人下肢运动能力,解决双足运动和稳定性的难题。第二阶段从1993至2000年,逐渐增加了头、身体和手臂,此时,可以说,一个完整的Asimo雏形初现。此后第三个阶段,本田似乎想要在Asimo的灵巧手上发力,机械手(B25J )的专利数量在2003-2008年达到顶峰,占据了本田机器人相关专利近60%。
最新发布的Asimo单手有 13 个自由度,双手自由度几乎占到全身自由度的一半,通过液压驱动实现精细动作,从而能比划手语,在不捏碎杯子的情况下拿起杯子。本田研发有限公司资深总工程师兼本田人形机器人项目负责人Satoshi Shigemi说:「很明显,整体的灵活度是必需的,并因为手部运行能力的提升,它能够完成更复杂的任务。
现实与梦想的差距
虽然酷似阿童木的Asimo一出生就受到世界人民的喜欢,但实际表现却不能像动画片里的机器人战士一样满足人们对人形机器人的一切幻想:只能完成“拧开盖子”“倒水”“踢足球”“跑步”这样的简单功能,会把高举手机照相的动作误认为“举手”,然后一直不停地说“有什么问题要问Asimo?”,充满电后仅能运动1小时。
Asimo更像是一个宣传人形机器人的大使,周游全球,这与本田想要机器人服务老年人的初衷背道而驰。除此之外,300-400万美金的造价,一个月10万人民币的租赁费也让人瞠目咂舌,而目前日本平均护工的工资也不过1.5万人民币/月。
虽然Asimo代表了人类一个时期最强的人形机器人,但高昂的成本、并不成熟的供应链体系、差强人意的表现,以及更聚焦细分功能、场景的扫地/服务机器人等商业进展迅速,最终导致Asimo在2018年退出历史舞台。
“地表最强”双足机器人Atlas,Born in 2013
Atlas,可谓是“流离失所、坎坷一生”。
1992年,学术派创业者Marc Raibert院士从麻省理工将Leg Lab 实验室(致力于研发腿式机器人)剥离出来,成立了波士顿动力公司。得益于Leg Lab优良的腿部运动研究基础,波士顿动力获得了美军的青睐,旗下人形机器人Atlas的雏形就源自于2009年为美军测试防护服性能的机器人Petman。
2013年,谷歌母公司Alphabet收购了波士顿动力,第一次市场化尝试却不如意,一个想要市场,一个坚持理想,冲突不断升级,终于,谷歌在2015年关闭了机器人部门Replicant,并在2017年将波士顿动力卖给了软银。然而,软银在愿景基金带来的约1.8万亿日元(约171亿美元)的投资亏损下,也不得不断尾求生,于2021年将波士顿动力卖给了韩国现代。
追求极致的运动能力
为了将运动能力做到极致,Altas使用了液压动力装置,依靠流体动力可在狭小空间实现密集解决方案,特别适合大负载的场合,例如运载火箭的发动机、中国空间对接综合试验台,还有那满大街的挖掘机。框架和腿则采用3D打印技术,巧妙的将液压管道内置在3D打印钛金属骨骼内,有点模仿人类血管在骨骼内那味儿了。
同时,通过头部的搭载的RGB摄像头和TOF深度传感器获取更加全面的环境信息,利用自创的“轨迹优化行为库"和模型预测控制器(MPC),根据运动情况调整其发力、姿势、动作发生时机等细节。
除了秀,还能干啥?
在以上如此优异的性能下,劣势也显而易见。首先,昂贵。Atlas使用了很多特殊和高成本零部件,一台造价就高达200万美金,而同台跳舞的的机器狗spot虽然售价不到1/20,也仅售出200来台。其次,“娇嫩”,维护成本高、噪音高、电耗高等。波士顿动力也承认,Atlas机器人的可靠性还无法与机器狗spot相比。最后,寂寞,找不到合适的应用场景。
Asimo、Atlas,虽然相差十三年,但结局却一样,高昂的成本、缺失的场景,只能沦为行业先驱。
2马斯克的擎天柱,再一次点燃信心
时间回到2006夏日的一天,马斯克梦到一个完全自动化的未来制造工厂,机器人高速制造所有东西,这些东西被传送带在正确的时间运送到正确的地方。梦醒后兴奋的马斯克,宣布特斯拉要用“机器生产机器”,也就是建立全自动化工厂模式。
接下来便是特斯拉众所周知的“产能地狱”经历。而自动化工厂的失败,并没有打消马斯克对于全无人工厂的执念,反而播下了量产“工人”的种子。他多次在公开场合发起了牢骚:为什么现在的机器人,都无法实现像人手一样实现“捡起零件并放置在电池上”这类简单的任务。
因此,当人形机器人Optimus发布时,马斯克还特意让机器人演示了一遍这个动作,以表成功。但从效果来看,Optimus还是落了个“高开低走“的状况,运动能力严重落后于公众预期。不过,它那双五指灵巧的手,还是值得深究,成为人形机器人商业落地的一个重要突破口。
Optimus的“灵巧手”
研究一双灵活的手
人手能以每秒300度的速度移动,拥有成千上万的触觉传感器和21个主动自由度,是人类劳动最完美的工具。而人类对机器人多指灵巧手的研究,则是从假肢开始的,作为一个单独学科,已经有64年的研究历史。
目前主流的灵巧手有两种方式,一种是内置式,即将驱动、传感、控制等所有的驱动执行零部件都集成在手掌内。典型代表的灵巧手,是由哈尔滨工业大学机器人研究所 (HIT) 和德国宇航中心 (DLR) 合作了20多年共同研发的,而这个手掌因为集成零件多,也是普通人手掌的1.5倍大。
另一种,则是外置式。即将体积较大的电机驱动器外置在手臂,采用拉线方式从远端控制灵巧手的关节。这种方时和内置相比,成本更低、难度也有所降低。典型代表是英国的shadow hand,而马斯克的Optimus也采用这种方式。
一岁婴儿就会抓取,但对于机器手而言,且不说完全比得上人手,即使可以使用,都走了一段半个世纪的研发路。那么,马斯克的Optimus,有什么不同呢?
人形机器人“第一手”
Optimus的设计灵感来自于生物学,和人手一样同样使用5个手指,拥有11个自由度。像拉线玩偶一样,由5根“经脉”(线驱动) 独立控制手指的弯曲和展开,负重20磅(9KG)和自适应抓取(能够抓取不同形状、尺寸的物体)的能力,因此,使得Optimus的手部劳动力能够胜任工厂的一般工作。
手腕则由两根执行器控制,这个设计不仅能让手腕转动,还可以做水平的动作,这也是目前市面上其他人形机器人鲜有见到的。除此之外,特斯拉还需要将4-5kg左右的电驱手臂集成在双足机器人上,这对人形机器人的行动、操作和精巧抓取都提出了更高要求。
虽然Optimus在技术领域实现了提升,但对于人形机器人而言,更重要的话题是:成本,能够量产降本才是核心。
量产的突破
马斯克准备用SpaceX的套路打造机器人,一切都是以规模产业化为目的,以指数级砍成本。
一方面大量复用特斯拉汽车现有技术降维打击,包括电池、散热、视觉避障等。胸腔内安置的2.3kWh的电池,能支撑Optimus工作一整天。这个耗电量,差不多也是一个成年劳动者一天消耗的能量。另一方面全身都没有使用特殊订制的零部件,而是优化了全身 28 个驱动器设计参数,最终采用通用的两类六种伺服关节(基于无框力矩电机+谐波减速器的旋转关节,基于力矩电机+滚珠丝杠的线性关节)。而至于Optimus比老人还走的慢,那是因为特斯拉损失了一定响应速度,以降低能耗。
通过这套流程下来,Optimus的吸引力大增:2万美金一台、一周工作7天、充电一次工作一整天。而对比之下,美国特斯拉工厂一个普通工人工资一小时最少16.2美元,一个月近6000美元,也就是说,3个月普通工人的工资,就能买下一台一周工作007、不会请假、不会抱怨的高效“廉价劳动力”。
而在小批量量产以后,马斯克还可以将Optimus放在特斯拉超级工厂里,边工作边迭代,也许将来有一天,我们会看到成千上万个Optimus在火星上帮人类搭建家园。
正是因为有了量产的规划、手的突破,因此,钢铁侠马斯克,还是给大家带来了很多期待。
3技术的演进路径
人形机器人的发展还处于突破技术壁垒的早期阶段,导航定位、环境感知、指令分析、行为控制等关键技术,都还没完成从“能用”到“好用”的长征,那么,会有哪些技术演进路径呢?
双足行走,不是移动机器人的唯一选择
双足对于人形机器人来说承担着移动的任务。但相比起来,轮式和四足机器人应用更成熟、成本更小、技术难度更低。波士顿动力曾公开表示,目前Atlas将不会商业化,真正实现商业化的是它的四足机器人。
这儿大胆猜测一下,特斯拉的Optimus,是否会像马斯克的第一辆电动酷炫超跑一样,目前的双足只是噱头,最终产业化的时候又会回到四足或是轮式?
机械手的灵敏度,反映人形机器人的技术实力
灵巧手的关节越多代表越灵活,能做的操作也越多。本田从足部运动转向机械手研究,雷军公开招募灵巧手机械工程师,也说明了人形机器人的玩家,开始意识到手的重要性。
机器人1.0时代的代表“机械臂”模仿人手在制造和组装流水线,进行着无聊的、重复的、固定的工作;机器人2.0时代的代表物流机器人,通过轮子在提前规划好的路径移动,利用视觉感知获取信息并判断,将物品搬运至固定的位置。
这两个阶段的“手”,也就是末端执行器,可以是带有喷枪、焊枪的工具,也可以是气动吸盘(如波士顿动力Handle Logistic机器人),又或是模仿人手的夹钳(如小米铁大)、三指夹爪等。
而机器人3.0时代的手,也许会是布满了传感器,通过感知物体的重量、大小、温度,采取不同的姿势和力度对不同形态的物体实施抓取,并使物体表面受力比较均匀,再加上头部的机器视觉、算法等技术,最终可以像人一样进行更准确的判断。
智能交互,才是我们期待的未来
“手”的操作离不开“脑”的决策,“智能化+类人形+低成本”是机器人发展的主要趋势。
机器人研发一般采用“本体—技能—智能”自下而上的研发路线,从双腿运动逐步扩展到手等功能部件,最后考虑智能化。人形机器人的未来将是,如何让人形机器人“更聪明”,面对复杂的跨场景工作模式,要真正地实现代替人,还需提升AI技术的感知能力。
目前的 AI 应用层面仍然过于单点化,只有 AI 能力实现,实现由单点智能向全局智能、由认知智能向决策智能的跨越,我们才能与更聪明的AI 机器人频繁互动。而通过硬件、算力、算法、数据等要素持续迭代升级,实现人与机器人之间达到人和人之间的交互体验,这也是终极人形机器人商业化发展的重要一步。
4结语
一款真正能成功产业化的产品,除了技术的成熟、成本的降低,最重要的还要有足够广阔的落地场景:例如二维码,也是在技术成熟15年后,才在微信“扫一扫加关注”这个场景下,得到了前所未有的应用。
而机器人行业,会有一道共性难题:标准化生产、和非标准化的应用场景。标准化、大规模生产,才有助于降低成本;但要实现大规模,场景必然会扩大,于是又会面临许多非标准化的需求。这是机器人不同领域、不同公司都要平衡的要素。
纵观目前大规模应用的各类机器人,能快速实现商业落地的,大多有几个特点:功能单一、使用场景固定、需求清晰,比如工业机械臂、扫地机器人等。而人形机器人既有优势、又有劣势,更需要对矛盾“把玩琢磨”。
一方面,人形机器人的天然优势在于其通用性。集成功能多、终极通用装置,一款成熟的产品即可适用于广泛的需求场景,不再有传统“工业机器人”、“服务机器人”这样明确的功能属性。因而,具备标准化、大规模生产的基础,可以快速降本。
但,另一方面,正是因为哪里都能用,所以,也有可能会显得,哪里都不是最好用,或者说,有些功能是冗余的。因此,找到场景就很关键。
比较之下,工业场景也许是人形机器人迈向产业化的第一块阵地。工业场景,既有需求,可以将人类从繁重、危险的“4D”工作中解放出来;又具备一定通用性,适配部分工业场景领域分散、各自规模较小的问题。同时,在经济性上,相对于C端客户,工业场景的支付意愿、能力也更高。
人形机器人,技术在不断突破新高,但人类的需求也在不断丰富、复杂。这是一场供给和需求的赛跑、技术和商业的较量,前后者之间,似乎就像程序员永远跟不上产品经理的步伐一样。但幸运的是,技术的发展,并非线性,奇点之后就会有极大跨越。
也正因此,在大众纷纷失望叹气之时,人形机器人领域创业者和投资人们,依然会在心里打气:这是“长坡厚雪”。