人形机器人技术的发展与现状

2023-08-16


技术革新+巨头入局+政策激励,多维度催化人形机器人落地

技术进步+巨头入局+政策激励加速 2023 年人形机器人产业发展。2023 年 ChatGPT 等大 语言模型超预期发展,增强人形机器人交互能力,拓宽其应用领域;硬件方面,特斯拉等 科技公司纷纷入局,有望加快产业链技术进步。我们认为人形双足机器人为通用机器人的 最优解,因为人类社会的种种事物都按照人类的生理结构进行设计,贴近人类形态的双足 机器人更能适应种类多样的任务,达到通用的目的,隐形成本较小。随着科技龙头入局、 ChatGPT 等 AI 技术加速、相关政策密集落地,作为“具身智能”理想载体的人形机器人 在多种因素的推动下有望快速发展。

大模型帮助机器人思考学习,推动具身智能发展。英伟达创始人兼 CEO 黄仁勋在 ITF World 2023 半导体大会上表示,AI 下一个浪潮将是“具身智能”,即能够理解、推理物理 世界并与物理世界互动的智能系统。微软、Google、英伟达等大厂均积极开展具身智能相 关研究。微软基于 ChatGPT 的强大自然语言理解和推理能力生成控制机器人的相关代码; 英伟达 VIMA 基于 T5 模型,将文本和多模态输入交错融合,结合历史信息预测机器人的 下一步行动动作;英伟达 OPTIMUS 使用任务运动规划器来自动生成足够的机器人轨迹数 据,然后训练 Transformer 视觉-运动策略,进而预测机器人动作;谷歌 RT-2 则通过 VLM 与机器人数据的结合,赋予机器人语义理解和基本推理能力。大模型不断进步提升人形机 器人交互能力,推动具身智能发展。

特斯拉机器人快速迭代,24 年有望在工厂投入使用。2021 年特斯拉在 AI Day 上首次提 出其人形机器人 Optimus 的渲染图;2022 年 AI Day 上,特斯拉推出原型机,在没有外接 线缆的情况下实现了缓慢行走与挥手;2023 年 5 月股东大会上,特斯拉人形机器人已经 可以实现流畅的行走与抓取物品,灵活度较原型机大大提高。2023 年 7 月 20 日,马斯克 表示,目前特斯拉人形机器人擎天柱的制造数量为 10 台左右,将会在 2023 年 11 月左右 对特斯拉自己设计的执行器进行行走等测试,明年人形机器人有望率先在内部工厂投入使 用。在应用场景方面,除了工厂以外,公司还考虑将人形机器人与 Neuralink 结合,为残 障人士提供义肢应用场景有望不断拓展。

多方玩家布局人形机器人,百舸争流加快硬件变革。除特斯拉外,国内外多家公司积极研 发人形机器人并取得快速进步。2019 年波士顿动力机器人 Atlas 掌握“体操”技巧,能够 连续的跳跃、翻滚;2022 年 8 月,小米发布人形机器人“Cyberone”;2023 年 4 月 1X technologies 机器人 EVE 应用于美国和欧洲部分地区的商业场景;优必选、傅利叶所生产 机器人都具备行走,与人协同完成动作等功能;三星宣布将于 2023 年 10 月阐述其 “Semicon 人形机器人”计划。各高校实验室也在积极尝试各种技术路径研发人形机器人, 清华大学交叉信息研究院陈建宇团队机器人“小星”采用准直驱力控方案,可完成多种动 作。多方玩家并驱争先,有望加速人形机器人硬件升级。

政策密集出台,加速人形机器人产业化进程。2023 年 6 月 28 日,北京印发《北京市机器 人产业创新发展行动方案(2023-2025 年)》,强调要对标国际领先人形机器人产品,支持 企业和高校院所开展人形机器人研发和工程化,目标在 2025 年前实现百台(套)级人形 机器人原型机的生产,并在 3-4 个典型场景中开展示范性应用。十四五以来,中央和地方 陆续推出支持人形机器人产业发展的政策,如《“十四五”机器人产业发展规划》、《“机器 人”应用行动实施方案》、《山东省制造业创新能力提升三年行动计划(2023-2025 年)》、 《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024 年)》等。多地 利好政策有望推动人形机器人加快工程化和产业化。

决策层:大模型赋予机器人“大脑”,具身智能迎来曙光

大模型使机器人理解自然语言,增强泛化能力

大模型为机器人装上“大脑”,提升其理解能力与泛化能力。谷歌 DeepMind 于 2023 年 7 月 28 日推出全球首个控制机器人的视觉-语言-动作(VLA)模型 RT-2;斯坦福大学李飞飞教 授研究团队于 2023 年 7 月 12 日推出 VoxPoser,通过大语言模型加视觉语言模型指导机 器人行动。搭载此类模型的机器人可以像 ChatGPT 一样被操纵,可理解自然语言指令并 且无需预定义的运动原语或额外的数据和训练,具身智能迎来曙光(具身智能指具有身体 并支持物理交互的智能体,可借助智能算法实现理解推理并与物理世界互动)。大模型的 发展使机器人更容易理解人类指令并执行动作以完成更好的交互,人形机器人产业化进度 有望加快。

RT-2/VoxPoser 实现自然语言编程,机器人“善解人意”。RT-2/VoxPoser 的一大突破是 使机器人可以理解自然语言指令,无需复杂的编程语言便可完成人机交互。RT-2 模型建 立在视觉-语言模型(VLM)的基础上,赋予机器人语义理解和基本推理能力,使其可以听 懂并自主推理出已灭绝动物(恐龙)和哪种饮料最适合疲惫的人(能量饮料);李飞飞团队 VoxPoser 模型只需接收到“打开上面的抽屉,小心花瓶!”类似的指令即可执行任务;在 前华为天才少年彭志辉创业公司智元机器人所发布的视频中,机器人也可根据简单的文字 或语音指令对桌面上不同颜色的方块进行选取、调位和叠放等操作。

无需训练即可完成复杂指令且产生涌现能力,未知场景下 RT-2 模型泛化能力翻倍。新模 型的另一大突破是无需预定义的运动原语或额外的数据和训练,模型泛化能力增强,加速 机器人通用化。过去算法下实现机器人扔垃圾的动作需训练机器人区分、捡起、扔掉垃圾 各个步骤,而 RT-2 可以将网络相关知识传给机器人,使其无需明确的训练即可学会扔垃 圾。面对之前从未见过的任务情形,RT-2 成功率达到 62%,泛化性能较 RT-1 提高一倍。 而 VoxPoser 用大模型指导机器人如何与环境进行交互,达到在无需额外数据和训练的情 况下完成各种任务,并且涌现出了 4 种行为能力,可以自主分步完成任务,掌握评估方法, 根据最新要求做出判断进而调整输出动作。

RT-2 泛化能力还体现在其思维链(CoT)助其进行多阶段语义推理,完成更复杂任务。 DeepMind 研究团队展示了将思维链推理纳入 RT-2 中使其能够进行多阶段语义推理,他们 用少量的“增强”数据微调一个 RT-2-PaLM-E 变种,增强数据中加入了“Plan”步骤, 使得 VLM 首先用自然语言描述机器人将要采取的动作的目的,然后再给出预测的机器人 动作标记。例如:“指示:我饿了。计划:选择 rxbar 巧克力。行动:1 128 124 136 121 158 111 255。”通过实验结果可以观察到,具有思维链推理的 RT-2 能够回答更复杂的命 令。

决策结果到运动控制映射方式改变,机器人实现“手脑协调”

此前大模型产出的策略需要借助低级别策略或 API 才能完成对机器人的运动控制。视觉语 言模型生成的结果到机器人动作的映射方式,主要取决于该预测结果的层级。之前模型中 预测结果处于高级别设计层级:以 Google PaLM-E 和微软 ChatGPT for Robotics 为例, PaLM-E 实现了对具身任务的决策方案预测,但不涉及机器人动作的实际控制,需要依赖 低级别的现成策略或规划器来将决策方案“翻译”为机器人动作。微软默认提供控制机器 人的低层级 API,ChatGPT 输出是更高层级的代码,需调用到机器人低层级的库或 API, 从而实现对机器人动作的映射和控制。RT-2 和 VoxPoser 预测结果已经到了低级别动作层 级,不需要再经过复杂的翻译即可将高层级设计映射到低层级动作。

RT-2 输出字符串可直接对应到机器人的坐标、旋转角等信息。RT-2 动作控制采用的方法 是将机器人动作表示为另一种语言,即文本 token,并与 Web 规模的视觉-语言数据集一 起训练。代表机器人动作的文本字符串可以是机器人动作 token 编号的序列,例如「1 128 91 241 5 101 127 217」,该字符串以一个标志开始,该标志指示机器人是继续还是终止当 前情节,然后机器人根据指示改变末端执行器的位置和旋转以及机器人抓手等命令。由于 动作被表示为文本字符串,因此机器人执行动作命令就像执行字符串命令一样简单。这种 表示方式允许谷歌对现有的视觉-语言模型进行微调,并将其转换为视觉-语言-动作模型。

Voxposer 规划结果直接为机器人运行轨迹。Voxposer 的动作控制实现过程是首先给定环 境信息(用相机采集 RGB-D 图像)和自然语言指令,之后 LLM(大语言模型)根据这些 内容编写代码,所生成代码与 VLM(视觉语言模型)进行交互,指导系统生成相应的操作 指示地图(3D Value Map),之后动作规划器将生成的 3D 地图作为目标函数,直接合成 最终操作轨迹。在用 LLM 和 VLM 将语言指令映射为 3D 地图的过程中,系统利用“感兴 趣的实体(entity of interest)”来引导机器人进行操作,也就是通过 3D Value Map 中标记 的值来反应哪个物体是对它具有“吸引力”的,哪些物体是具有“排斥性”,比如在打开 抽屉的例子中,抽屉就是“吸引”的,花瓶是“排斥”的。

感知层:聚焦力传感器应用,机器人知“轻重”懂交互

人形机器人需借助多种传感器识别自身运动状态和环境状况,收集多模态数据以供交互。 具身智能重点在于具有身体体验的能力,与环境交互获得视、听、触觉等多模态数据再做 出反应,需要模型与传感器等硬件相互配合。李飞飞教授团队在介绍 Voxposer 的论文中 提到,具身智能依赖于外部感知模块,在需要整体视觉推理或理解细粒度物体几何形状的 任务中具有局限性,需要更高级的视觉传感器或其他传感方式。因此人形机器人产业化不 仅需要大模型完成决策,还需要传感器等硬件不断升级进行配合,提供多模态数据。

六维力/关节扭矩传感器为力控核心,使人形机器人知“轻重”

力传感发展仍处初期,六维力传感器和关节扭矩传感器是核心。在机器人多种感知中,力 觉感知及对应的力传感器发展较慢,但其在人形机器人的运动控制中起重要作用,可以增 强机器人本体感知及获取环境物理信息的能力。力传感器是人形机器人感测力和力矩信息 的主流选择,可协助机器人完成精细和智能的操作任务。人形机器人力感知主要包括两种 模式,一种使用末端的六维力传感器,一种使用关节扭矩传感器。人形机器人旋转、线性 执行结构类似于人类关节,对于力的感知相对简单,可采用关节扭矩传感器;而对于人形 机器人末端执行器(如腕部、踝部)在执行操作的过程中,力的方向和作用点都在三维空 间内随机变化,测量需要精确处理,六维力传感器更符合需求。

六维力传感器精度高、获取力信息最全面。六维力传感器是一类可以同时检测 X、Y、Z 三轴方向的力和绕三个坐标轴方向的力矩的传感器,目前已应用于协作机器人和康复医疗 机器人中,可以增强机器人与人协同的安全性。六维力传感器测量维度最高,可以提供最 全面的力觉信息,其具有高精度、高灵敏度、快速响应、高耐用性和可靠性的特点,可以 轻松检测到微小的力的变化,实时记录和传输数据,满足各种应用的需求。相较于三维力 传感器,六维力传感器适用于力的作用点离传感器标定参考点距离较远,且随机变化,测 量精度要求较高的情况。同时机器人可以利用获得的力矩信息推算受力部件的姿态,监测 力矩是否在安全范围内,有效避免传感器的过载损坏。

六维力传感器主要用于人形机器人腕部及踝部。六维力传感器可装载于机器人的腕部、踝 部等核心关节处,让机器人知“轻重”、懂交互,真正实现类人的运动能力。双足机器人 由于有脚掌的存在,其在落足时会产生力矩,测量该力矩的大小和方向是运动控制中的重 要一环。六维力传感器可搭载于双足机器人脚踝处,测量各方向的力和力矩,并由控制器 通过分析传感器输出的各维度数据,得出落脚时的受力状态,从而对机器人姿态进行调整。 六维力传感器还适用于人形机器人手腕关节处,机械手在执行抓取或装配工作时,会受到 各方向的力,有六维力传感器作为感知元件,机器人才能精准执行这些工作,甚至做到 “穿针引线”。

关节扭矩传感器增强机器人本体感知。关节扭矩传感器将扭转力矩引起的物理变化转换成 精确的电信号,从而形成对机器人单关节力矩的测量和记录。机器人本体感知依赖关节扭 矩传感器感测各个关节扭力,获得各个部位受力情况,提供机器人整体的姿态及位置信息。 关节扭矩传感器可以实时反馈高质量扭矩信号,迅速识别接触并立即降低力和速度,因为 该传感器距离电机较近,避免了机器人机械本体动态特性的干扰,带宽更高,动态响应更 快。关节扭矩传感器本质测量一维力,但要抵抗五维力的干扰,抗干扰能力要求高。

高价值高壁垒,六维力传感器面临动静态特性及解耦问题

进口六维力传感器价格昂贵,国内外产品在多方面仍存在差距。2022 年,在接受高工机 器人采访时,坤维科技创始人熊琳表示:“一台高性能的进口力传感器的价格顶得上国内 一台协作机器人的价格,导致国内机器人行业用不起,加之标校能力和生产方式等多方面 的约束,国内多数六维力传感器厂商无法满足产能需求,阻碍了第三代工业机器人的发 展。”高性能六维传感器价格从几千到上万不等,价值量较高。国内参与者主要是鑫精诚、 宇立仪器(安川电机、KUKA、ABB 的力传感器合作商)、坤维科技(供货给节卡、遨博、 睿尔曼、大族等国内协作机器人厂商),但国产六维力传感器与外资主流传感器在灵敏度、 串扰、抗过载能力及维间耦合误差等方面仍存在差距。

应变片式为当前六维力传感器主流,硅应变传感器在稳定性、信噪比、刚度方面表现较好。 根据 GGII,六维力传感器根据传感元件的不同主要分为三种基本类型:应变片式、光学式 以及压电/电容式。应变片式可分为金属电阻应变片和硅应变片,当基体受力发生应力变化 时,应变片也一起产生变形,使应变片的阻值发生变化。压电/电容式中,电容是通过极距 的变化导致电压变化,压电则是通过形变改变电荷。光学式则通常使用光栅或其他光纤技 术检测光功率并将其转换为电能。目前市场应用的大部分是基于应变片式的测量,其具有 灵敏度高、测量范围大、可靠性高、技术成熟等优点。其中硅应变传感器在稳定性、信噪 比、刚度方面有比较优势。

应变片式传感器的弹性体结构是关键,一体化和 Stewart 并联为主流。应变片式六维力传 感器的弹性体结构设计是核心问题,传感器的结构受到其应用场合的限制,而力敏感元件 的形式和布置直接影响传感器的灵敏度、刚度、动态性能、维间耦合等,很大程度上决定 传感器性能的优劣。六维力传感器的典型结构设计主要是一体化结构(竖梁、横梁)和 Stewart 并联结构。以 Waston 腕力传感器为典型代表的竖梁结构横向效应好、结构简单、 承载能力强,但竖向效应差、维间干扰大、灵敏度较低;十字横梁结构灵敏度高、易加工, 易于标定,但存在维间耦合和径向效应;Stewart 平台中弹性体采用复合式结构,该类传 感器具有结构紧凑、承载能力强、误差不累积等优点。

六维力传感器选型难度大,技术难点集中于保持优良的静态性能、动态性能和低维间耦合。 六维力传感器选型难点在于应用多样性、复杂性。由于传感器量程和精度成反比关系,选 择合适量程的传感器才能使精度达到最大;同时在复杂应用场景下,传感器本体是否能适 应应用场景也需要考虑;此外还要综合考虑精密机构当中的传感器如何安装在狭小空间内, 如何与机构融为一体等问题。六维力传感器选型四个核心步骤为确定量程需求——确定使 用环境——确定机械出线需求——确定通讯方式。六维力矩传感器技术难点集中于需兼顾 优良的静态性能、动态性能和低维间耦合。未来六维力矩传感器需要六维联合加载标定设 备等先进仪器、动态特性优化和矢量运算中的解耦算法解决技术难点。

难点一:六维力传感器非线性特性显著,需要更为复杂的六维联合加载标定。标定是指通 过加载理论值的载荷并同时记录传感器输出的对应原始信号的方式,获得六维力传感器内 部算法的各个参数,建立传感器原始信号和受力之间的映射关系。标定解耦是六维力传感 器提高精度的主要方法,因此标定工作在传感器的研发过程中扮演着重要角色。现有标定 装置存在较多局限性,如加载载荷有限、无法进行复合加载、无法加载所有维度正负方向、 维间耦合较大等。这些局限性因素限制了六维力传感器标定的有效性,影响其最终使用精 度,只有采用六维力联合加载标定,才能使传感器的准度更好、串扰更低。

难点二:实际应用条件复杂,动态性能优化算法仍需提升。六维力传感器使机器人实现柔 顺化、智能化控制,因此在动载荷下性能指标要求更高。在实际的力/力矩测量过程中,被 测信号大多是动态信号,如机器人打磨抛光时的接触力、物体高速运动过程中的称重和炮 弹发射过程时的后座力等,这些信号属于快速时变信号,动态性能较差的传感器跟踪测量 这些信号难度较大。且当前动态性能的分析方法很难获得完全意义的冲击信号和阶跃信号, 造成感应系统的精度下降。当前业界主要使用优化自身结构、形状等方法提高动态性能, 国内外学者还尝试利用动态补偿滤波器、遗传算法、神经网络算法等智能算法来提高传感 器的动态性能。

难点三:维间耦合问题无法彻底避免,解耦算法纷繁复杂。理想的六维力传感器,每一方 向输出通道的电压值仅取决于该方向作用力/力矩的大小,与其余五个方向作用力/力矩大 小无关。但是由于传感器的结构设计、机械加工的精度、贴片技术、应变片横向效应与检 测方式等方面的原因,几乎每一维作用到传感器上的力/力矩分量都会对传感器的各路输出 信号产生影响,造成维间耦合问题。因此需要解耦算法来对六维力传感器的输出进行解耦, 消除维间干扰,提高传感器的测量精度。但当前对于多维力传感器的解耦问题并没有统一 的处理方法,需根据实际情况及传感器结构进行选择和优化。

六维力传感器+本体感知带来机器人手部物品姿态估计新解法

位姿估计是机器人领域重要问题,特殊环境下视觉反馈算法估计物品姿态可靠性较差。早 期位姿估计算法包括模板匹配和特征点检测,前者预构建目标位姿模板库,检索得到最相 似模板图像对应位姿;后者提取目标二维图像特征,构建关键点匹配后使用 N 点透视法解 算。这两种方法依赖物体表面颜色纹理,受环境因素影响大。之后三维相机在机器人视觉 领域得到应用,引入场景三维几何信息提高目标位姿估计精度,但其需要人工设计图像特 征提取方式,泛化性能差。近期 PoseCNN 构建卷积神经网络自动提取图像特征,采用端 到端的方式回归物体三维位姿,但总体来看基于视觉系统的位姿估计算法应用场景受到较 大限制,在视觉被阻碍的环境中(狭窄空间进行精细装配或操作)估计结果可靠性较差。

六维力传感器搭配本体感知提供机器人手部物品姿态估计新解法。2023 年 7 月,RSS 会 议上刊登了机器人感知手部物品姿态解决方案的论文,密歇根大学机器人系的 Andrea Sipos 和 Nima Fazeli 利用机器人本体感知(自身关节处扭矩传感器的感知反馈)以及手 腕上六维力传感器的触觉反馈,并使用接触粒子滤波器算法,定位接触位置并估计物体姿 态,简称 SCOPE,该方法可精确的完成接触位置的确定和物体姿态的估计,有望推动人 形机器人的位姿估计能力。

SCOPE 可精准确定接触位置,快速迭代估计物体姿态。SCOPE 方法是在接收到六维力 传感器和关节扭矩传感器的信号数据后,使用接触粒子滤波器处理,完成物体姿态识别。 上述论文中的实验选用来源于德国宇航局的 Franka Emika Panda 机器人,其是一款高性 能七轴协作机器人,每个关节都配有扭矩传感器,力控性能在同类型机器人里面处于领先 地位,手腕的六维力传感器则是美国企业 ATI 生产。在估计过程中虽然初始分布有较大的 误差和高方差,但 SCOPE 可以在短短几次迭代中以低方差估计物体姿态。并且实验发现, 即使对于较小的,非凸形状的工具,SCOPE 方法依然可以给出较为精确的姿态估计结果。

使用接触粒子滤波器算法进行采样定位,提供准确力信息。现有的物体姿态估计信号处理 算法可以分为三大类:几何匹配、概率方法和机器学习方法。目前主流方法是使用概率方 法(粒子过滤器、SLAM 和蒙特卡洛方法等)来估计物体的姿势,其中粒子滤波器所需计 算量小,且在非线性情况下表现较好,常被用于定位、跟踪物体等问题。Sipos 和 Fazeli 使用了两个互补的接触粒子滤波器(Contact Particle Filter):一个用于估计接触位置,另 一个用于估计物体姿态,都是在接收到关节处扭矩传感器和手腕处六维力传感器的信号后 进行概率分布的计算更新,帮助去除来自环境的噪声和不确定性,得到更准确和可靠的接 触力信息。

MultiSCOPE 实现多个接触跨物体姿态估计,助力机器人使用人类工具。Sipos 和 Fazeli 进一步于 2023 年 6 月提出 MultiSCOPE,该方法使用本体感知和手腕处六维力传感同时 估计两个物体在未知配置情况下被两个协同手臂抓取的姿态。该方法由单个物体的感知扩 展到多接触的交互,实现了跨动作的物体姿态估计。在该实验中机器人手持扳手可以拧动 一个螺钉,即机器人既可以感受到直接接触的扳手形态,又可以通过扳手和另一只手臂上 的力传感器感受到螺钉的状态变化,估计两个抓取物体的姿态,从而完成多任务。该实验 的成功使机器人具备多物体的感知能力,有助于机器人操作人类工具完成多项任务,提高 人形机器人多场景下的通用性。

六维力传感器+本体感知技术使姿态估计向多模态+高效连续性发展。基于六维力传感器和 本体感知的物体姿态估计技术为机器人感知并抓取物体提供了新解法。该方法可与其他方 法完成多模态互补,在无遮挡场景中,视觉感知方法可以与 SCOPE 共同使用以提高性能: 比如机器人可以使用视觉反馈来初始化作用域和初步识别,提高感知效率。SCOPE 技术 未来的发展方向也会集中于减少收敛到准确的物体姿态估计所需的动作数量和连续的下一 步动作选择算法,以提高机器人抓取物体的连续性和高效性。SCOPE 与六维力传感器的 结合有望加快人形机器人实际应用。

执行层:刚性驱动器方案成熟,准直驱方案渗透率有望提高

特斯拉采用成熟的刚性驱动器方案,未来准直驱方案渗透率有望提高。机器人关节驱动器 按动力来源可以分为液压、气动、电驱等。液压虽然功率高,但可靠性和精度低,噪音大, 成本高;气动柔顺性好,安全性高,但精度差,时滞高。电驱因其精度、安静、高效方面 的优势逐渐成为主流,其经过 30 多年的发展,经历了从刚性驱动器、弹性驱动器到准直 驱驱动器的过程。特斯拉采用的是最早推出,也是相对成熟的刚性驱动器方案。如果电机 和减速器性能没有大幅提升的情况下,在双足机器人领域刚性驱动器将会逐步被取代。近 几年新兴的准直驱驱动器技术发展迅速,未来有望替代传统的刚性驱动器。

刚性驱动器技术相对成熟,整体设计较难创新。1983 年,早稻田大学研究出刚性驱动器 (TSA),自此 TSA 在双足仿人机器人上广泛应用。结构上,TSA 是常规无刷电机驱动高 传动比减速器,有些在电机端增加刹车,在减速器和输出端增加高刚性力矩传感器。力矩 测量上,TSA 是基于电流或应变片式力矩传感器。控制上,TSA 控制简单,精度高。功率 和效率方面,TSA 无功率可调,效率较低,安全性较差。TSA 整体设计方面已经较难有创 新,在合适工作区间内的最大输出功率密度只能到 200-300W/kg,远没有达到动物肌肉的 500W/kg,同时也解决不了机器人受外部冲击时零部件强度问题,目前的研究集中在优化 设计上。

弹性驱动器技术路线多样,多数结构和控制复杂。动物利用刚柔并济的肌肉骨骼系统在运 动过程中储存和释放能量,调节能量在时间和功率密度上的不匹配,提高关节爆发力,同 时能够实现落地缓冲。1995 年,MIT 推出弹性驱动器来模拟肌肉系统功能,使关节表现出 柔顺、安全和高能量效率特性,目前已演化出 SEA、PEA、CEA 和 MEA 多种结构。弹性 驱动器多在刚性执行器的基础上串联或并联弹性体。力矩测量上与刚性传感器较为类似。 控制上,多数弹性驱动器方案结构与控制复杂,精度一般。综合来看,由于弹性体引入, 系统为欠驱动,给控制带来了难度,尤其在机器人腿部使用,机器人整机的运动控制比较 难实现。

准直驱驱动器是新兴技术,编码器和电机功率密度为其主攻方向。受限于工艺和技术,电 机直驱的扭矩密度不能满足机器人应用的需求,因此,2016 年 Wensing 等推出准直驱驱 动器(PA),采用电机加低传动比减速器(如行星减速器)的方案,实现高带宽力控和良 好的抗冲击能力。2023 年 UCLA 也采用了类似的方案设计了不同于特斯拉的新型人形机 器人结构。结构上,PA 主要由高扭矩密度电机、低传动比减速器、编码器和控制板等组 成。力矩测量上,PA 应用电流环检测。控制和效率上,PA 精度高,效率高。安全性上, PA 由于具有反驱特性,安全性好。PA 未来主攻方向是编码器技术的创新和电机功率密度 的提高。

刚性驱动器 VS 准直驱驱动器,成熟系统 VS 高效新解法。结构布局方面,刚性驱动器是 常规无刷电机驱动高传动比减速器,直接带动输出端,有些设计在电机端增加刹车,在减 速器和输出端增加高刚性力传感器,准直驱驱动器是高扭矩密度电机驱动低传动比减速器, 输出端具有小惯量特性;力矩测量方面,刚性驱动器是基于电流或应变片式力矩传感器, 准直驱驱动器是应用电流环检测;控制方面,刚性驱动器控制相对简单,精度高,准直驱 驱动器控制简单,精度相比刚性驱动器来说较低;能量特性方面,刚性驱动器的效率较低, 而准直驱的效率较高。安全性方面,刚性驱动器的安全性比较差,准直驱驱动器由于具有 反驱特性,安全性好。

文章推荐

相关推荐