1. 引言
新冠疫情催生无人产业,成为人形机器人发展的重要契机。随着新一轮科技革命和产业变革加速演进,新一代信息技术、生物技术、新能源、新材料等技术变革,促使人形机器人产业升级换代。人形机器人作为实现具身智能的最佳物理形态之一,具有强大的环境适应能力、拟人化工作能力和亲近感,可以广泛应用于工业生产、社会服务、救援救灾等领域,成为一种多任务通用型机器人。人形机器人的大规模应用,有望解决未来社会劳动力短缺的难题,并对经济和社会发展带来颠覆性的影响。
2023年1月12日,国际机器人联合会(IFR)发布最新版《世界机器人研发计划》。日本、韩国、欧盟、德国和美国采取了各不相同的研发资助战略。日本政府的《机器人新战略》在2022年投入了超过9.305亿美元,包括将成为下一代人工智能和机器人核心的集成技术。韩国政府出台的《第三版智能机器人发展计划》,推动机器人成为第四次工业革命的核心产业。政府为《2022智能机器人行动计划》拨款1.722亿美元。欧盟的重点研究与创新框架计划《地平线欧洲》,2021年至2022年为机器人相关工作计划提供了总计1.985亿美元的资金(EU, 2020) [1] 。德国政府的《高科技战略2025》,每年都将提供6900万美元的资金,到2026年,总预算为3.45亿美元。研究课题包括数字辅助系统,例如人机协作或支持移动办公的解决方案(BMBF, 2018) [2] 。美国《国家机器人计划3.0》(NRI-3.0)》提供了1400万美元的资金支持,主要研究集成机器人系统(NSF, 2021) [3] 。美国航空航天局(NASA)推出的《从月球到火星》计划,旨在提高机器人性能,以协同支持深空人类探索及科学任务(IFR, 2023) [4] 。
本文回顾梳理了世界主要经济体在机器人领域所制定的研发资助战略;借助文献计量工具CiteSpace形成的关键词聚类图谱和时间线图谱,对人形机器人领域当前研究热点领域以及技术前沿趋势进行量化分析;同时,通过梳理人形机器人当前重点企业发展历程,对当前产业特点、创新突破口以及即将面临的挑战进行定性分析。最后,从政策、技术及产业等维度,对国内人形机器人领域研究及未来产业商业化落地提出四点建议。
2. 研究现状
以“Humanoid Robot”作为主题词,在Web of Science核心合集科学引文索引数据库(SCIE)中进行检索。文献语种设定为英文,文献类型设置为“论文(Article)”和“论文集(Proceeding Paper)”,检索时间设置为2019年1月1日至2024年2月1日,检索得到1602篇文献。去除不相关文献,共得到有效文献1594篇。本研究利用CiteSpace 6.2.R3对有效文献进行可视化分析,从研究热点和前沿趋势两个维度,分别形成关键词聚类图谱(图1)和时间线图谱(图2),从而掌握国外学界关于人形机器人的研究态势,为国内人形机器人相关技术研究人员提供参考。
Source: Science Citation Index Expanded (SCIE) Mapping Tool: CiteSpace 6.2.R3数据来源:科学引文索引数据库(SCIE) 制图工具:CiteSpace 6.2.R3
Figure 1. Keywords clustering knowledge graph of humanoid robot research from 2019 to 2023
图1. 2019~2023年间人形机器人研究关键词聚类图谱
Source: Science Citation Index Expanded (SCIE) Mapping Tool: CiteSpace 6.2.R3数据来源:科学引文索引数据库(SCIE) 制图工具:CiteSpace 6.2.R3
Figure 2. Timeline knowledge graph of humanoid robot research from 2019 to 2023
图2. 2019~2023年间人形机器人研究时间线知识图谱
2.1. 研究热点
基于2019年1月1日至2023年2月1日期间国际范围内人形机器人研究领域文献数据,以学科类别为聚类规则,形成人形机器人研究关键词聚类图谱(图1),可以看出,研究热点主要集中在:实验心理学,公共、环境和职业健康,影像科学与摄影技术,计算机科学与控制论,生物物理学、计算机科学与跨学科应用、计算机科学与信息系统、电信学、计算机硬件与架构、精神病学、复合材料与工程、环境科学、运筹学与管理科学、工程机械等学科。
从机器人学(Robotics)的学科定义来看,机器人学是与机器人设计、制造和应用相关的跨学科研究,又称为机器人技术或机器人工程学。主要涉及运动学和动力学、系统结构、传感技术、控制技术、行动规划和应用工程等学科。随着生成式人工智能大模型技术的发展,极大加速了人形机器人的进化。大模型嵌入机器人本体,为机器人加速自主思考和执行突破、迈向具身智能阶段带来诸多新的可能。具身智能(Embodied AI)包含具身感知(Perception)、具身想象(Imagination)和具身执行(Execution)三个模块,涉及计算机视觉、认知科学、仿生设计、机器学习、物联网等诸多学科,各学科相对成熟的积累为具身智能的进一步发展提供基础。
首先,通过视觉、触觉等传感器交互感知,构建具身感知模型。人形机器人的主要目标是在现实场景中实现安全可靠的人机协作。研究人员研发出一种适用于各种任务的新型高性能人形机器人ARMAR-6。研究团队垂直整合了整个硬件和软件架构开发缓解,各学科融合旨在促进各功能无缝集成和转换(Asfour, T., Waechter, M. et al., 2019) [5] 。其中,硬件结构包括涉及力学相关双手协作、抓取技能,物联网技术相关集成感知功能等。软件架构包括机器学习领域内面部及语音识别功能,自然语言理解等。另外,由于人形机器人灵活的肌肉骨骼手很难建模。对于使用手进行的物体识别、接触检测和接触控制,最好只使用一个集成网络。因此,研究人员开发了一种使用具有参数偏差的递归神经网络来获取肌肉骨骼手的传感器状态方程的方法,从而实现抓取物体的识别、接触模拟、检测和控制,并且可以通过更新参数偏差来应对随时间的退化、初始化的不可再现性等(Kawaharazuka, K., Tsuzuki, K. et al., 2020) [6] 。研究集成仿生学、力学控制、动力学以及数学建模等领域成果,解决了人形机器人手的灵活控制问题。
其次,具身想象旨在构建仿真引擎,模拟具身任务,为机器人具身执行提供支撑。与人形机器人相比,人类非常擅长在脚步放置受限的环境中行走。寻找良好的垫脚石运动解决方案是机器人技术面临的长期且根本性的挑战。因此,研究团队将强化学习应用于动态运动仿真,给出了模拟人形、真实双足机器人和怪物角色的结果,实现在每种情况下都会针对具有挑战性的垫脚石序列和地形产生稳健、合理的运动(Xie, Z., Ling, H. et al., 2020) [7] 。此外,灵活的关节对于人形机器人实现类人运动以及精密执行活动至关重要。人形机器人实现类人运动通常需要在多自由度机器人关节中使用可变刚度执行器(VSA),这是人形机器人执行器的前沿技术。研究提出一种新颖的VSA模块,设计用于仿生人形机器人Binocchio,以准确估计输出扭矩和刚度,还显示了驱动和加固机构的动态响应。最后,实验表明驱动系统能够复制Binocchio设想的类人运动学、扭矩和刚度曲线(Rodriguez-Cianca, D., Weckx, M. et al., 2019) [8] 。研究运用柔性材料优化了人形机器人的关节控制、动作设计以及运动优化,能够有效提高人形机器人的运动精度和稳定性。
再次,具身执行是指基于计算机视觉、机器人学和计算机图形学,通过多模型训练,在多传感器合作下完成任务执行。机器人操作本质上是连续的,但通常具有底层离散结构,例如抓取物体。研究提出了一个基于经验的规划框架alef,重用了类似模式的训练数据。同时提出了一种分层规划方法,使用神经网络算法中的离散线索来对有用的模式转换进行偏置搜索,并通过模式转换的权重来告知(Kingston, Z., Kavraki, L. et al., 2023) [9] 。此外,为了在未来能够使人形机器人仅通过听音乐就跳舞,研究人员提出一个框架,能够为给定的音乐生成一系列三维人类舞蹈姿势。框架由三个部分组成:音乐特征编码器、姿势生成器和音乐流派分类器。研究集成了上述组件,从而生成逼真的人类舞蹈动作(Ahn, H., Kim, J. et al., 2020) [10] 。
2.2. 前沿趋势
基于2019年1月1日至2023年2月1日期间国际范围内人形机器人研究领域的文献数据,结合技术人形机器人时间线知识图谱(图2),可以梳理总结出学界在人形机器人领域呈现的三大技术发展趋势。
一是传感器成为实现“具身感知”的关键。计算能力的迅速崛起促使人们渴望开发更多的社交、类人机器人。建造能够感知感觉的机器人是未来发展的一条富有成效的途径,因为人们比以前建立的机器人更愿意感知更广泛的机器人的思想方面。研究结果表明,年龄是人们对机器人进行思维归因的一个关键因素,这表明可能会出现代际转变,更加接受机器人的行动和感知能力(Jacobs OL., Gazzaz, K. et al, 2022) [11] 。人形机器人感知模块是运控和交互基础。感知(Sensor)是软硬件结合,多组传感器阵列(Sensor Arrays)进行数据融合,类似于人类的各类感官神经,提供视觉、位置感知、触觉等信息。例如,研究人员设计了一个服务机器人平台GARMI,作为触觉通信的化身以及远程医疗和紧急援助的界面,旨在为家务劳动提供支持。其独特的人形设计采用配备传感器的多模态头部,专为自然人机通信而设计,以及用于安全物理人机交互的全身扭矩控制界面。此外,每个系统组件都可以主动产生和感知力,因此在与其环境和用户交互时可以充当触觉反馈界面。此平台揭示了基于使用驱动和力的全身控制移动人形机器人在老年人护理日常生活和远程医疗场景中的潜力(Trobinger, M., 2021) [12] 。其中,触觉传感器(Tactile Sensor)可以让机器人拥有类人触觉,从而实现人机交互。柔性触觉传感器又称为“电子皮肤”,能够实现与环境接触力、温度、湿度、震动、材质、软硬等特性的监测,是机器人直接感知环境作用的重要传感器,有助于人形机器人实现产业化落地(Cui, C; Park, S, 2021; Kaymak, Ç et al., 2023) [13] [14] 。研究人员认为,电子皮肤技术的复杂性在材料、设备、复杂的集成方法和无干扰数据采集方面提出了重大挑战。这些挑战涵盖从功能材料、器件架构、像素设计、阵列结构和数据采集方法到干扰可忽略不计的多模态传感性能。研究介绍了电子皮肤柔性可拉伸多模态传感器领域的最新研究趋势和方法,重点关注柔性可拉伸平台、器件和集成架构、各种纹理传感和处理触觉传感数据的机器学习算法的可靠采集方法等方面(Jeon, S., 2019) [15] 。
二是通用人工智能(AGI)赋能有望加速实现物理交互,但需谨慎数据安全。目前在强化学习(Reinforcement Learning)、人机交互(Human Robot Interaction)、辅助机器人(Assistive Robot)、面部识别(Facial Expression Recognition)等领域已产生大量研究成果。例如,研究团队与第三方公司联合开发Pepper医疗机器人,通过远程控制Pepper的言语和头部动作,和患有痴呆症的老年人进行对话,从而揭示医疗机器人在与患有痴呆者的老年人沟通中的认知发展,展示了人工智能和自然语言处理技术的实际应用(Tanioka, T., Yokotani, T, et al., 2021) [16] 。研究人员还利用此前团队开发的基于机器学习的移动应用程序PandaSays,经过改进和集成向Alpha 1 Pro机器人发出指令,以提高人形机器人的情感状态解读能力(Popescu, AL.; Popescu, N. et al., 2022) [17] 。此外,2024年2月29日,Figure AI宣布与OpenAI达成了重要的技术合作协议。双方将共同利用OpenAI的GPT系列大模型,增强人形机器人的语言、推理以及理解能力。这一合作旨在加速AGI机器人的研发和商业应用,为未来智能机器人领域带来更多创新(朱秋国、熊蓉,2023) [18] 。然而,人工智能技术赋能机器人发展的同时,也带来了不同类型的安全、隐私和法律问题。研究利用PLS-SEM技术开发了一个概念模型,并指出隐私和安全问题影响家庭对家用机器人的使用。研究还发现很少有人意识到法律影响,并期望通过使用机器人来获得很多好处(Chatterjee, S., 2024) [19] 。
三是仿生设计的研究步伐加快。伴随着运动规划(Path Planning)、行为科学(Behavioral Sciences)、机械臂(Robotic Arm)、腿式运动(Legged Locomotion)、轨迹优化(Trajectory Optimization)等持续突破,人形机器人的仿生研发创新将迎来爆发。其中,关于腿式运动,欠驱动平衡在杂技机器人等原型控制模型中受到了相当多的关注。当试图将这些解决方案转变为腿式机器人的平衡时,与摩擦限制接触和配置空间的底层流形结构相关的技术挑战阻碍了直接应用。研究提出了一种新的平衡控制框架,将约束最优控制策略与最近的基于变分的线性化方法相结合,以解决常见简化四足动物模型的平衡问题。MIT Mini Cheetah的仿真和硬件结果证明了控制器利用身体角动量进行两足扰动恢复的能力,以及从质心离开支撑多边形的情况中恢复的能力。这些结果和公式的普遍性表明了对两足动物和类人动物的进一步应用的探索(Chignoli, M., Wensing, P. M., 2020) [20] 。此外,人形机器人领域内的人机交互(HRI)的问题和质量已成为学术界广泛争论的话题。研究基于仿生陪伴框架开发了一种新颖的交互系统。仿人服务机器人与系统集成并进行初步测试。结果表明,基于仿生陪伴框架的交互系统可以帮助服务人形机器人有效响应交互环境的变化,例如在不同场景下对同一角色做出不同的响应(Yang, JJ, Chew, E. et al., 2021) [21] 。
3. 产业发展
依据国际上人形机器人代表性企业的研发历程,本文对国际上人形机器人产业发展的最新动态进行了梳理,并得出三点结论。
3.1. 企业自发推进技术研发
人形机器人的巨大潜力引起全球主要经济体的高度重视。当前国外人形机器人技术研发主要依靠企业自发。国外代表性产品主要包括特斯拉Optimus、波士顿动力Atlas、1X 旗下的EVE和NEO,以及Agility旗下的Digit。其中,特斯拉人形机器人不断迭代,为人形机器人产业链带来了“从0到1”的重要发展机遇。
2023年12月,马斯克在社交平台X上发布特斯拉第二代Optimus人形机器人的宣传视频,并表示将在12月份正式推出。Optimus第二代的主要亮点在于新增的触觉传感器、力传感器以及更强大的平衡感知能力。第二代的关键升级在于智能大脑,Optimus二代拥有更为精准的智能大脑技术,或内置ChatGPT技术,使得数据和反馈更加精准,整体能力有所提升。Optimus目前正在接受神经网络端到端的训练。可见,此次迭代升级展示出了人形机器人在任务操作方面的先进性,以及更多的“智慧”能力。融合眼手足,结合智能芯片、智能算法,构建形成类人“超级大脑”,可能成为未来技术发展趋势(Electrek, 2023) [22] 。
3.2. 技术突破引领产业落地
特斯拉多次技术突破实现人形机器人性能的持续迭代升级,逐渐明确人形机器人产业落地。仅从2024年以来,特斯拉已分别于1月16日、1月31日、2月24日先后三次发布Optimus的视频,实现人形机器人性能的持续迭代升级。2月24日,特斯拉人形机器人Optimus取得最新进展。通过社交平台上展示的最新视频,Optimus人形机器人已经拥有流畅步行能力(IoT World Today, 2024) [23] 。特斯拉表示,Optimus第二代将首先应用于其制造工厂,一旦其实用性得到验证,公司将开始销售该机器人。此外,人形机器人产业进展时间线进一步明确。1月25日,马斯克在2023 Q4财报电话会议上表示2024年人形机器人出货;2月21日,机器人执行器总成厂商在电话会上进一步明确机器人产业发展的时间线预期,预期2024年底/2025年初量产,坚定机器人量产信心。
3.3. 产业量产面临挑战
人形机器人未来潜力巨大,但仍面临高算力、弱技术、高成本、不安全四大挑战。据国际机器人协会预测,2021年至2030年,全球人形机器人市场规模年复合增长率将高达71%。Optimus产品的快速迭代下,人形机器人产业逐步进入商业化前夜,目前正处于螺旋式向上的发展阶段。短期内人形机器人有望先在制造业普及,随后拓展至家用、公共领域(顾浩楠,2023) [24] 。据国际投行高盛预测,到2035年,人形机器人市场规模有望达到1540亿美元(高盛,2022) [25] 。
然而,人形机器人产业实现大规模量产和商业化落地,面临四大挑战。一是算力能力需求大。人形机器人的姿态、速度和力度等方面,都需要高算力,现阶段的计算能力面临巨大挑战。二是基础技术能力薄弱。只依靠现有的软件算法和产业链支持,无法提升产品的创新能力。三是研发成本高昂。造血能力弱、高额亏损、研发投入高,是人形机器人行业的常态。四是数据安全能力和体系均存在不足,面临安全隐私等问题(孟繁科,2023) [26] 。
4. 结论
本文基于科学引文索引数据库(SCIE)中2019年1月1日至2024年2月1日期间人形机器人相关文献为研究对象,利用可视化计量工具CiteSpace将文献数据以知识图谱的方式展示了研究热点及前沿趋势,得出以下结论:第一,从学科类别来看,人形机器人属于跨学科研究,是机器人学、计算机视觉、认知科学、仿生设计、机器学习、物联网等诸多学科的集大成者。本研究从具身感知、具身想象和具身执行三个模块进行了文献分析,现有研究热点主要包括人机协作、面部及语音识别、力学控制、仿真模拟、运动优化、深度学习、柔性材料等多个方面。第二,从前沿趋势来看,传感器成为实现“具身感知”的关键,柔性触觉传感器,即“电子皮肤”将成为人形机器人产业化落地的突破点。通用人工智能为人形机器人带来了机遇与风险,在增强语言、推理以及理解能力的同时,也带来了数据安全泄露等问题。此外,人形机器人的仿生研发创新将迎来爆发,将解锁人形机器人在不同应用场景的拓展。
另外,依据国际上人形机器人代表性企业的研发历程,本研究对国际上人形机器人产业发展进行了梳理,并得出三点结论:第一,当前国外人形机器人技术研发主要依靠企业自发。特斯拉人形机器人不断迭代,为人形机器人产业链带来了“从0到1”的重要发展机遇。第二,特斯拉多次技术突破实现人形机器人性能的持续迭代升级,逐渐明确人形机器人产业落地。第三,人形机器人未来潜力巨大,但仍面临高算力、弱技术、高成本、不安全四大挑战。
基于上述分析,本文从政策、技术及产业等维度为人形机器人的未来发展提出四点建议。第一,推动制定与人形机器人配套的实质性支持政策。加强数据安全及风险评估,深化科技伦理风险研判能力,推进制定相关伦理标准规范。第二,大模型等人工智能技术赋能加速,在关键技术和技术创新体系实现突破。加快人形机器人与元宇宙、脑机接口等前沿技术的融合。第三,借鉴特斯拉电动汽车技术及产业发展经验,借他山之石,攻创新之玉。参考特斯拉自研芯片、超级计算机应用于电动汽车的成功经验,未来有望拓展至人形机器人。第四,人形机器人应优先在制造业落地,与工业机器人共同推动制造业智能化,并逐步走向服务业及家庭场景。预计2025年人形机器人将有望实现制造业场景应用的突破,小批量应用于电子、汽车等生产制造环境。