人形机器人技术的发展与现状

2023-08-16

技术创新、行业巨擘的参与以及政策的支持,从多个层面共同推动了人形机器人的实际应用与普及。

在2023年,人形机器人的行业增长步伐显著提速,得益于技术进步的飞跃、科技巨头的强力进入以及政策激励的协同作用。这一年见证了ChatGPT等大语言模型超预期的发展,这极大地增强了人形机器人与人类之间的交互体验,从而扩展了其广泛的应用场景。

与此同时,特斯拉等业界领先的科技企业纷纷加码布局,预示着产业链的技术革新速度有望大幅提升。我们坚信,人形双足机器人为通用机器人领域的理想解决方案。这一判断的基础在于,几乎所有的社会设计都围绕人类的生理结构展开,在此背景下,仿照人类形态并采用双足移动方式的人形机器人能够胜任多样的任务,并实现通用化目标,同时在成本控制上展现出显著优势。

伴随着科技巨头的深度参与、人工智能技术的加速发展和政策层面的支持力度增强,人形机器人的前景呈现出蓬勃发展的态势。这些因素相互作用下,这一领域有望迎来快速增长期,成为“具身智能”的理想实践平台。

在ITF World 2023半导体大会上,英伟达创始人兼CEO黄仁勋提出,未来AI发展的核心趋势将是“具身智能”,这涉及构建能够感知、理解物理世界并与其互动的先进智能系统。微软、Google和英伟达等科技巨头均投入资源,积极研发具身智能技术。

微软依托ChatGPT的强大自然语言处理与推理能力,生成用于控制机器人的代码;而英伟达则通过VIMA项目,基于T5模型,巧妙融合文本及多模态输入信息,并结合历史数据预测机器人下一步的动作。在这一过程中,英伟达的OPTIMUS系统运用任务运动规划工具,自动生成丰富的机器人轨迹样本,进一步训练基于Transformer架构的视觉-运动策略,实现精准动作预测。

通过这些大模型的持续进步和优化,人形机器人的交互能力显著提升,从而加速了具身智能领域的进展。

特斯拉的机器人技术正以惊人的速度实现迭代升级,预期于2024年在公司的生产线上投入使用。早在2021年的AI Day上,该公司首度揭示了其人形机器人Optimus的概念图;次年,在同一场合,特斯拉展示了一款原型模型,能够仅靠内置的动力系统完成缓慢的移动与手势表达。进入2023年,于年度股东大会上展出的人形机器人,已经展现出了流畅的步伐和物品抓取能力,展现出显著的操作灵活性。

马斯克在7月20日时提到,当前特斯拉已生产约10台人形机器人原型,并计划于同年11月开始对自家研发的执行机构进行行走等性能测试。预计到明年人工智能驱动的人形机器人将有望首先在内部工厂实现实际应用。就应用层面而言,除了制造业场景外,公司亦积极探索与Neuralink的整合方案,为残疾人士提供更广泛的辅助设备选择,预示着未来人形机器人的应用场景将不断扩展和深化。

众多行业巨头与创新企业竞相布局人形机器人领域,这一趋势如同百船竞技于激流之中,加速推动着硬件技术的革新与变革。自2019年波士顿动力公司的Atlas机器人成功展现体操级技巧,连续跳跃和翻滚,至2022年8月小米公司发布的人形机器人“Cyberone”,再到2023年初X technologies推出的商用场景应用机器人EVE在美欧地区实现广泛部署。同时,优必选、傅利叶等公司的产品均实现了行走与协同人类完成任务的能力。三星计划于同年10月宣布其名为“Semicon”的人形机器人的开发项目。

此外,各高校的科研实验室也在积极探索多样化的技术路径,致力于研发更高级的人形机器人。例如,陈建宇团队在清华大学交叉信息研究院的研究成果——“小星”机器人,采用先进的准直驱力控方案,能够执行多种复杂动作,展现出科技与创新的深度融合。

综上所述,这一领域内多方位的竞争与合作不仅推动了技术的迅猛发展,更预示着人形机器人的硬件升级有望加速实现,为未来带来无限可能。

在6月28日,北京市发布了旨在加速机器人产业创新发展的《北京市机器人产业创新发展行动方案》,此方案明确指出将瞄准国际前沿的先进科技,大力扶持企业与高校科研机构,在人形机器人研发和工程化领域持续投入。目标是在2025年前,实现规模化的人形机器人原型机制造,并在特定场景中开展示范性应用。

自“十四五”规划启动以来,国家及地方政府相继推出一系列政策以支持人形机器人的产业发展。这些政策包括《“十四五”机器人产业发展规划》、《“机器人”应用行动实施方案》、《山东省制造业创新能力提升三年行动计划》以及《深圳市加快推动人工智能高质量发展高水平应用行动方案》等。多地的利好政策共同促进了人形机器人技术的研发和产业化进程,使其工程化速度显著提升,并加速了其在各领域的广泛应用。

决策层将大模型赋能于机器人,为其注入了智慧的核心,这一举动预示着具身智能领域正踏入崭新的纪元。

在2023年7月28日,谷歌DeepMind推出了全球首个人工智能创新——RT-2视觉语言行动模型,为机器人的智慧中枢装上了一颗崭新的大脑。与此同时,由斯坦福大学李飞飞教授领航的研究团队于同月12日发布了VoxPoser,此项目以大语言模型及视觉语言模型的融合为核心,赋予机器人以指导性的行动力。

搭载这些先进模型的机器人,如同ChatGPT般被操控自如,能够准确理解自然语言指令,并且无需预先设定的动作脚本或额外的数据与训练。这一壮举标志着具身智能时代的新曙光——具身智能是指那些拥有实体形态并能与物理世界进行互动的智能体,凭借智能化算法实现深度的认知推理和实践操作。

随着大模型技术的飞速发展,机器人现在能够更加深入地理解人类的命令,并通过执行精准的动作以实现更为流畅、高效的交互体验。这一突破将加速人形机器人的产业化进程,预示着人工智能与物理世界融合的新纪元即将来临。

RT-2/VoxPoser 破除了传统机器人的界限,赋予其自然语言理解能力,实现了一种更为亲民且流畅的人机交互体验。这一技术革新在于其无需深奥编程语言便能实现指令执行,而仅依赖于直观且通俗易懂的自然语言输入。

RT-2/VoxPoser 建基于视觉-语言模型架构,不仅赋予了机器人理解语义信息的能力,并且还内嵌了一定水平的基本逻辑推理机制。通过这一创新,机器人能够对复杂指令进行解析,并自主推断出灭绝动物与特定场景下的最佳应对策略;同时还能根据不同个体的状况,精准匹配和推荐最适合的能量饮料。

以李飞飞团队研发的VoxPoser模型为例,其仅需接收包含具体行动指示的文字指令就能立刻响应执行。而在彭志辉所领导的智元机器人公司公开演示中,这一功能被进一步实现场景化应用:机器人能够理解并依据简单的文本或语音指令,对桌面上不同颜色的几何块进行挑选、位置调整和堆叠操作,展现出了高度智能化与灵活性。

RT-2展现出卓越的泛化能力,尤其是在借助其思维链进行多阶段语义分析与复杂任务执行方面。DeepMind的研究团队通过将思维链推理整合进RT-2系统之中,成功地使其能够开展多步逻辑推演,并完成更为复杂的作业。他们仅对一个名为RT-2-PaLM-E的变体进行了少量增强性微调,引入了“Plan”这一关键步骤,此步骤要求VLM首先以自然语言阐述机器人即将执行动作的目的,随后对预期的机器人行动进行预测。示例如下:“指示:我已感到饥饿。计划:选择rxbar巧克力。行动:1 128 124 136 121 158 111 255。”

通过实践验证,融入思维链推理后的RT-2显著提升了对复杂指令的处理能力,并在执行过程中展现出更加智能与高效的表现。

在先前的大规模模型所采用的战略中,运动控制机器人的任务往往需要借助于较低层次的策略或API才能得以实现。视觉语言生成的预测成果与机器人操作之间的映射机制,其具体实施方式则根据该预测内容所在的层级而有所差异。

过往的模型通常限于对高级决策方案进行预测,如Google PaLM-E和微软ChatGPT for Robotics等案例所示,它们能够预见到具身任务的决策路径,但并未深入到直接操控机器人的动作层面。这些情况下,决策方案需要通过低级别的现成策略或规划器转化为实际执行的机器人动作。而微软提供了一套专用于控制机器人的底层API,其ChatGPT输出则表现为更高层级的代码指令,需要进一步调用与机器人底层系统相关的库或API,以此实现从高层级设计到低层级操作动作的有效转换。

值得注意的是,诸如RT-2和VoxPoser等模型在预测结果上已达到了更低的操作层级,这一特质意味着其预测成果可以直接对应于具体的机器人动作执行,无需经过繁琐的翻译过程,就能将抽象的设计概念无缝转化为具体的操作指令。

RT-2的输出模式能够精确对应于机器人的三维坐标位置与旋转角度信息。其动作控制机制通过将复杂的机器人操作转化为文本标记,进而结合大规模互联网级的视觉-语言数据库进行训练实现。代表特定机器人操作的文本串是一系列编号组成的序列,例如“1 128 91 241 5 101 127 217”,此序列以一个特殊标志开始,该标志标识了接下来的动作是继续展开还是终止当前的任务流程。随后,机器人将根据该指令调整其末端执行器的位置、旋转以及其它相关操作,如改变机器人的抓手状态。由于机器人动作被精炼为文本指令的形式,因此执行这些动作就如同遵循一条命令序列一般简便易行。这一表示方法赋予了谷歌对现有的视觉-语言模型进行针对性优化的能力,从而成功构建出了一款具备高级功能的视觉-语言-行动模型。

Voxposer的规划方案直接受控于机器人路径生成,通过其先进的动作控制机制,首先获取环境数据并解析自然语言指令。接着,基于这些输入,大型语言模型编撰相应代码,此代码与视觉语言模型协同作用,指导系统创建3D价值地图。该3D价值地图作为目标函数输出,直接驱动最终的操作轨迹合成。

在将语言指令转化成三维地图的过程中,系统利用“感兴趣实体”的概念来指引机器人的操作决策。通过分析3D价值地图中各元素的值分布,系统识别出哪些对象对机器人具有吸引力,而哪些则为排斥力源。此举确保了机器人能够更加智能地执行任务,同时提高了操作的精确性和效率。

感知层部署了聚焦力传感器技术,使机器人能够精确感知施加的力与重量,从而具备了对物理环境的细腻触觉和智能互动能力。

人形机器人通过集成一系列精密传感器来感知其自身的活动状态以及环境的变化,并收集多样化数据以实现高效互动。具身智能的核心在于模拟人类的直接体验能力,即在与实际环境的交互中获取包括视觉、听觉和触觉等多源信息,进而作出相应反馈;这一过程要求机器人模型能够与硬件系统紧密结合。

根据李飞飞教授及其团队在Voxposer项目中的阐述,具身智能的实现依赖于外部感知系统的支持,在处理需要全面视觉推理或精细理解物体几何特征的任务时存在局限性。为了突破现有瓶颈,提升对复杂环境的理解和适应能力,可能需要引入更为高级的视觉传感器或采用其他类型的传感技术。

人形机器人产业化的推进,不仅要求大模型在决策层面实现智能优化,还需硬件系统的不断升级与之相配合,以确保收集到多模态、高质量的数据。这一综合性的策略旨在全面增强机器人的感知能力和执行效率,从而促进其在更广泛场景中的应用和发展。

尽管力传感领域尚处于探索初期阶段,其中以六维力传感器及关节扭矩传感器为主要组成部分,其技术发展相对滞后于整体机器人感知体系的构建,然而在人形机器人运动控制领域的实践应用中却发挥着举足轻重的作用。这一技术进步显著强化了人形机器人的本体感知能力与对环境物理信息的获取水平,使之能够更加精准地响应和适应外界状况。

力传感器作为人形机器人感测外部施加力及力矩的重要工具,对于实现其在复杂操作中的智能决策与精细动作有着不可或缺的价值。其应用主要围绕两种模式:一是末端配备六维力传感器,用于捕捉更为精确的力学数据;二是采用关节扭矩传感器,专为模拟人类运动关节特性而设计,以适应简单旋转或线性执行任务。

对于人形机器人而言,尤其是那些具备类似人体关节结构的设计,在面对力的感知与控制时往往较为直接。通过配置关节扭矩传感器即可有效满足其需求,实现对力量变化及施力方向的准确把握。然而,当谈及末端执行器在执行特定任务过程中所面临的挑战时,情况则更为复杂。由于力的方向和作用点在三维空间中呈现随机性变动,因此对这种动态力场进行精确测量与解析,则成为衡量六维力传感器性能的关键指标。这一技术的突破将极大地提升人形机器人在高精度、复杂操作环境中的适应性和效能。

六维力传感器以其极高的精确度与全面性,成为了获取机械压力数据的顶尖选择。这些传感器具备独特能力,能够同步检测三维空间中的三个轴向力和围绕这些轴产生的扭矩,使其被广泛应用于协作及康复机器人领域,显著提升了人机协同的安全水平。

凭借测量维度上的极致优势,六维力传感器能够提供详尽且完整的力学感知信息。其特性包括高精度、高灵敏度、快速响应速度、卓越的耐用性和可靠性,能够捕捉到极其细微的压力变化,并实现数据的实时记录与传输,全面满足各类应用场景的需求。

相较于传统的三维力传感器,六维力传感器更适应于处理作用点远离传感器校准基准点且动态变化剧烈的情景下,其测量精度要求更为严格。通过利用获取的扭矩信息,机器人能有效计算出受力元件的姿态,并监控扭矩是否处于安全范围之内,从而避免了潜在的传感器过载和损坏风险。

总之,六维力传感器以高超性能为诸多高科技领域提供了强有力的支撑与保障,为实现更加精准、安全的人机交互与自动化控制奠定坚实基础。

六维力传感器主要应用于人形机器人的腕部与踝部的关键关节部位,旨在赋予机器人以类似于人类的感知能力,使它们能够体验到“轻重”之感,并实现流畅、自然的交互及运动。在双足机器人中,落脚时产生的力矩是其运动控制过程中的重要参数;通过部署于脚踝处的六维力传感器,能实时测量并捕捉各维度下的力与力矩信息。控制系统基于这些传感器反馈的数据进行分析,精确评估落脚瞬间的受力情况,并据此调整机器人姿态,以确保稳定、高效的行走。

对于人形机器人的手腕关节而言,六维力传感器扮演着至关重要的角色,在执行诸如抓取和装配等精细操作时尤为关键。机械手在面对不同方向的外力作用下,仅靠精确的力反馈能力才能完成任务,如穿针引线般的高精度工作,这归功于传感器所提供的精准感知数据,从而确保机器人能以卓越的性能进行复杂作业。

关节扭矩传感器是提升机器人本体感知的关键元件。它将物理变化中的扭转力矩转化为精准的电信号,以此形成对单个关节所施加力矩的精确度量与记录。通过感测各关节的扭力,该传感器能捕获不同部位的受力状态,为机器人提供整体姿态和位置信息。

关节扭矩传感器能够实时反馈高质量的扭矩信号,并在检测到接触时迅速识别,并即时调节力与速度以做出响应。因其安装位置靠近电机,故能有效避开了由机器人机械本体动态特性所引发的干扰,从而实现更高带宽与更快速度的动态响应。作为本质测量一维力的传感器,它需具备极高的抗干扰能力来应对复杂的五维度力干扰,确保在复杂环境中仍能保持稳定与精确的操作性能。

进口六维力传感器的市场定价极为高昂,这一价格区间远远超出了国内工业机器人的预算范畴,坤维科技的创始人熊琳在接受高工机器人采访时指出,“高性能的进口力传感器价格之昂贵,甚至能与一台协作机器人的成本相匹敌。”这不仅导致国内机器人行业受限于成本压力而难以大规模应用先进传感器技术,同时,由于标校能力、生产方式等方面的限制,众多国产品牌在供应规模上难以满足市场需求。这一状况成为制约第三代工业机器人发展的瓶颈。

高性能六维力传感器的价格区间广泛,从几千元至数万元不等,体现了其较高的价值密度。国内主要的参与者包括了鑫精诚、宇立仪器,以及坤维科技。然而,尽管国产品牌在六维力传感器的生产中展现了一定的技术积累和应用基础,但与外资主流品牌相比,在灵敏度、交叉干扰、过载能力以及各轴间耦合误差等方面仍存在显著差距。

当前时代中,六维力传感器领域以电阻应变片式为代表,而硅应变传感器以其在稳定性能、信号噪声比和刚性方面的卓越表现,备受推崇。根据GGII的深度分析报告指出,在传感元件的具体分类下,六维力传感器主要划分为三大基本类型:应变片式、光学式以及基于压电或电容原理的传感器。

其中,应变片式又细分为金属电阻应变片和硅应变片,当基体在受力作用下产生应力变化时,与之相关的应变片亦随之发生形变,从而导致其阻值的变化。而在压电/电容式的框架内,信号通过改变极距或形状以转换电压或电荷;而光学式传感器通常利用光栅或光纤等技术检测光功率并转化为电能。

在当前市场应用中,应变片式测量占据了主导地位,其优势显著体现在灵敏度的高精度、广泛的测量范围、高度的可靠性以及成熟的技术支持之上。尤其值得关注的是,硅应变传感器在其稳定性、信噪比和刚度方面展现出明显的优势,进一步巩固了其在现代技术领域的领先地位。

应变片式传感器的弹性体设计为其核心要素,其中一体化及Stewart并联架构占据主导地位。对于应变片式的六维力传感系统而言,其弹性体制的构建方案构成了决定性的问题。该传感器的实际功能受制于特定的应用场景约束,而力敏感元件的选择与布局,则直接影响着灵敏度、刚度、动态响应性能以及各维度间的耦合程度,这些因素对传感器整体效能有着直接且显著的影响。

六维力传感系统的经典设计框架主要包括一体化结构及Stewart并联式架构。以Watson手腕力传感为例,这类采用纵向效应良好、结构简洁且承压能力较强的竖梁结构,在垂直方向上却存在明显的局限性,并伴随着较大的维度间干扰及较低的灵敏度;而十字形横梁结构则在灵敏度和加工便利性方面表现出色,并易于进行校准,然而仍需应对维度间的耦合与径向效应的问题。

Stewart平台通过采用复合式弹性体设计,成功地在紧凑的结构、强大的承压能力以及无累积误差等方面实现了优化,展现了其独特的技术优势。

在选择六维力传感器时,面临着一系列高难度挑战,关键在于平衡并实现其卓越的静态性能、动态性能以及低维间耦合效果。这一过程被广泛认为是复杂而细致的工作,尤其是考量到传感设备需要适应于多种应用情境和需求上的多样性。

具体而言,选择合适的六维力传感器需在量程和精度之间做出精准决策——量程与精度间的反比关系要求我们在确定传感器时,既要满足任务的实际需求以保证性能的全面性,同时也应着重考虑其对精确度的影响。在复杂的实际环境中,传感器自身的兼容性和适应性成为考量的首要因素。

此外,在精密机械结构中,如何将传感器恰当地集成于有限的空间内,使之不仅不破坏整体设计的和谐,还能与之完美融合,这也是一项不容忽视的挑战。

整个选型过程被划分为四个核心步骤:首先,确定量程需求以满足应用任务;其次,细致考量使用环境的特定条件和要求;接着,评估并选择符合机械接线布局的传感器类型;最后,决定适宜的通讯方式,确保数据传输的效率与可靠性。六维力矩传感器在技术层面上,其核心挑战在于如何在兼顾静态性能、动态表现的同时,有效解决低维度间的耦合问题。

展望未来,为应对这一系列的技术难点和挑战,创新解决方案被寄予厚望,包括借助先进仪器如六维联合加载标定设备进行精确校准,优化传感器的动态特性以及在矢量运算中实现有效的解耦算法。这将推动六维力矩传感器技术的发展,助力其实现更高水平的应用与性能提升。

在研发过程中,面对六维力传感器显著的非线性特性与复杂性,采取了更为精密且全面的六维度联合加载标定策略。这一过程通过施加理论载荷,并同步记录传感器输出的原始信号,旨在获取内部算法的各项参数并建立传感器响应与实际受力间的精准对应关系。标定解耦化被确立为提升六维力传感器精度的关键途径,彰显出在传感器开发阶段核心角色的重要性。

当前的标定装置仍存在诸多限制:加载能力受限、难以实现复合性加载、无法覆盖所有维度的方向以及各维度间相互影响较大等问题,这些局限性直接制约了六维力传感器标定的有效执行与最终应用精度。唯有借助于六维度协同加载的全面标定方法,方能确保传感器性能的卓越,显著降低内部干扰和串扰问题,从而实现更加精准、稳定的测量效果。

面对复杂多变的应用环境及动态性能优化的挑战,提升六维力传感器的能力以实现机器人在动载荷下的精细控制和智能化操作变得至关重要。当前,系统的核心难点在于,面对如机器人打磨、抛光等场景中的快速变动接触力,或高速运动物体称重以及爆炸物发射过程中的剧烈后座力时,仅依靠传统方法难以充分捕捉到这些动态信号的细节与精确性。

在实际应用中,被测量信号往往具有高度的瞬变性和复杂性。传统的传感器在处理此类动态信号时,常常会遇到跟踪难度大、跟踪精度低的问题,尤其是在对快速变化的冲击和阶跃信号进行准确识别和响应方面存在不足。这不仅限制了传感器的整体性能,同时也影响了整个系统的工作效率与准确性。

为应对上述挑战,业界目前采取的策略包括优化传感器自身的结构设计及形状以提升动态响应能力,并探索利用智能算法来增强其动态性能。例如,通过设计优化的结构和形状,可以有效改善传感器的响应速度和稳定性;而基于动态补偿滤波器、遗传算法或神经网络等的智能方法,则旨在更精确地预测并适应信号变化,从而提高传感系统在复杂动态环境中的表现。

综合而言,面对实际应用中动态性能优化的需求,不仅需要在硬件层面进行结构创新和优化,还需结合先进的软件算法来增强传感器对快速变化信号的感知与处理能力。未来的发展趋势将是融合更多元的技术手段,以实现更高精度、更快速响应及更强鲁棒性的传感系统,从而满足日益增长的高性能需求。

面对维间耦合这一技术挑战,我们认识到在设计六维力传感器时,各方向输出信号间的紧密关联性实难避之。理论上,理想的六维力传感器应在单一方向上仅受该方向作用力或力矩的影响而产生电压值变化,但实际中,由于传感器结构、制造精度、贴片工艺以及应变片的横向效应等因素的综合作用,每个维度上的力或力矩都会对所有输出信号施加影响。这一现象导致了维间耦合问题的存在。

为了克服这一障碍并优化测量性能,解耦算法成为不可或缺的技术工具。通过精确分析和处理六维力传感器的输出数据,这些算法能有效地去除不同方向间的干扰,显著提升传感器在复杂环境中的测量精度和可靠性。然而,由于多维力传感领域中尚未形成统一的标准解决方案,针对具体应用场景及传感器特性的定制化优化显得尤为重要。因此,在面对解耦问题时,灵活选用并不断调整优化策略是实现高效、精准数据获取的关键所在。

综上所述,尽管维间耦合问题难以彻底消除且解耦算法的选择与优化相对复杂,但通过深入理解其原理和实施针对性的技术改进措施,我们仍能在很大程度上提升六维力传感器的性能,满足对测量精度有着高要求的应用场景。

在机器人工程领域,定位与姿态评估构成核心议题,尤其是在特殊作业环境下,仅凭视觉反馈机制对物品的姿态估计存在显著不稳定性。早期所用算法包括模板匹配和特征点识别技术;前者预先构建目标模型的位姿图库,通过对比寻找最接近的目标图像对应于特定角度位置;后者则是提取二维图像中的特征点并基于N点透视理论计算出精确位姿。

上述方法在很大程度上依赖于物体表面的颜色与纹理信息,此类特性易于受环境因素的影响,从而影响评估结果的准确性。随着三维摄像头技术的应用普及到机器人视觉系统中,这一问题得到了一定程度的改善,通过引入场景的三维几何数据来提升定位精度。然而,这通常需要人工设计图像特征提取策略,并且其泛化能力有限。

近年来,PoseCNN方法以卷积神经网络为核心,实现自动识别和提取图像特征,并采用端到端的学习方式直接回归物体在三维空间中的精确位姿。尽管如此,基于视觉系统的定位与姿态评估算法仍然存在较广泛的应用限制,在视觉信息被遮挡或干扰的环境中时,其估计结果的可靠性相对较弱。

综上所述,当前机器人领域对更加智能、适应性强且环境感知能力出色的位姿评估技术的需求日益增长。

于2023年七月,《机器人学研讨》大会发表了一篇探讨机器人手部物品姿势估算新策略的文章。密歇根大学机器人工程系的研究者Andrea Sipos与Nima Fazeli,凭借其创新的整合手法,在机器人本体感知及手腕安装的六维力传感器收集的触觉数据的基础上,引入了接触粒子滤波算法。此方法旨在精准识别接触点位置,并推断物体的姿态。命名为SCOPE的技术方案,不仅能够实现高精度的接触定位与姿态估计,且为提升人形机器人的位姿估算能力开辟了新的前景。

基于六维力传感器及关节扭矩传感器获取的数据信息,本文阐述的方法——SCOPE采用了接触粒子滤波技术处理这些信号,实现了对物体姿态的有效识别与精准定位。此研究采用的机器人平台是由德国航空航天中心提供的Franka Emika Panda,这款高性能七轴协作机器人的每一个关节都配备了扭矩传感器,其力控性能在同类机器人中名列前茅,手腕处装备有由美国ATI制造的六维力传感器。

在实验过程中,尽管初始估计可能存在较大误差及高方差,SCOPE方法却能够在短时间内通过少量迭代实现低方差的姿态估测。值得注意的是,在面对非凸形状且尺寸较小的工具时,该方法依然能提供相当精确的姿态评估结果。这一特性表明,即使在复杂或挑战性高的环境下,SCOPE也展现出其优越的性能和应用潜力。

采用接触粒子滤波器算法进行采样定位与提供力反馈信息,此技术在现有的物体姿态估计信号处理领域中占有显著地位。当前,物体姿态估计相关的信号处理策略主要被划分为几何匹配、概率推断及机器学习三大类别。

主流的技术路线聚焦于应用概率方法来估算物体的姿势,包括粒子过滤器、同时定位与地图构建以及蒙特卡洛模拟等方法。其中,粒子滤波器因其计算效率高且在非线性场景下的优异表现,常被应用于定位、跟踪对象等具体问题中。

Sipos 和 Fazeli 提出了一套集成的接触粒子滤波器算法体系,旨在精准识别与评估接触位置和物体姿态。该体系通过接收到关节处的扭矩传感器数据以及手腕部位的六维力传感器反馈信息,进行概率分布的实时更新。此举有效过滤环境噪声与不确定性,从而确保了获取到更精确且可靠的接触力数据。

在2023年六月之际,Sipos与Fazeli携手创新,共同推出MultiSCOPE这一革命性技术,旨在实现跨物体的姿势估计功能,以此增强机器人的应用能力尤其是其对人类工具的操作。该方法巧妙地融合了本体感知及腕部六维力传感技术,以期在未知配置情境下精确捕捉两个物体通过两组协同运动的手臂抓取时的姿态信息。

MultiSCOPE的成功之处在于它将单个物体的感知能力拓展至多点接触和交互领域,进而实现对跨动作过程中物体姿态的有效估计。具体而言,当机器人手持扳手以拧动螺钉之时,其不仅能够直接感知到扳手的形状特征,还能够通过结合扳手与另一手臂上力传感器收集的信息,进一步推测出螺钉的状态变化以及两者间的相互作用。这一技术突破使得机器人的多任务执行能力得到显著提升,尤其是对于那些涉及多个物体操控的任务而言,MultiSCOPE赋予了机器人在复杂且多变的环境中更强的适应性和实用性。

综上所述,通过MultiSCOPE这一创新解决方案,我们不仅见证了机器人操作领域的一次重大飞跃,同时也预示着在未来,随着此类技术的进一步发展和完善,人形机器人将能在更广泛的场景中展现出其独特价值,为人与机器的协作开辟更加广阔的前景。

采用六维力传感器与本体感知技术,姿态估算领域正朝向多模态融合与高效连贯性的前沿方向演进。借助六维力传感器和本体感知的物体质态估计技术,为机器人提供了崭新的感知及抓取物体策略。

此方法在不同模式下能与其他解决方案相互补充,特别是在无遮挡的场景中,视觉感知与SCOPE技术协同工作以优化性能:机器人可利用视觉反馈来初步定位作用域并进行识别,从而提升感知效率。未来,对于SCOPE技术的发展而言,关键在于减少达到精确物体质态估计所需的动作次数,并构建出更佳的连续动作选择算法,以此增强机器人的抓取行为的连贯性和执行效率。

六维力传感器与SCOPE的集成有望加速人形机器人在实际应用中的部署和普及。

在执行层面上,刚性驱动器技术已步入稳固的发展阶段,并积累了丰富的实践经验。与此同时,聚焦于精准控制和效率提升的准直驱解决方案正逐渐获得市场的认可与采纳,其渗透率展现出显著的增长潜力。这一趋势预示着随着技术的进一步成熟和完善,准直驱方案将有望加速在特定应用场景中的普及,为行业带来更加高效、灵活且高精度的动力解决方案。

特斯拉采用了先进的固态驱动系统解决方案,预示着在未来,高精度直接驱动架构的应用渗透率将显著提升。机器人关节中的动力源主要包括液压、气动以及电动等多种类型。

与之对比,尽管液压传动拥有高功率的优势,但其在可靠性及精确度上的局限性,加之噪音大和高昂的成本,限制了其广泛应用。相比之下,气动系统因其良好的顺应性和极高的安全性而受到青睐,然而,由于精度不足和时滞较高的问题,它并非理想选择。

电动驱动凭借其卓越的精度、宁静的操作以及高效的性能,逐渐成为行业内的主流选择。历经数十年的持续创新与迭代,该领域已从刚性驱动器的发展阶段迈向了弹性驱动器及更先进的准直驱驱动器时代。特斯拉所采用的固态驱动方案是最早被开发和验证成功的实例。

鉴于电机与减速器性能进步的空间有限,在双足机器人技术领域内,传统的固态驱动系统可能会逐步被更高精度、更加适应复杂运动需求的直接驱动系统所取代。近来,准直驱驱动器技术取得了迅猛发展,并展现出替代传统固态驱动系统的潜力,预示着其未来在机器人行业的广泛应用和变革前景。

刚性驱动器领域技术相对稳固,其整体设计在创新层面颇具挑战。于1983年,早稻田大学开创了具有里程碑意义的刚性驱动器,自此,TSA成为了双足仿人机器人的主要动力源之一。

从结构角度来看,TSA是以传统的无刷电机为核心,配以高传动比减速系统,部分型号还集成了电机端刹车和减速器与输出轴间的高精度力矩传感器。在力量测量方面,TSA通过电流或应变片式力矩传感器实现精准监测。

TSA的操作控制相对简洁高效,并能确保较高的性能精度。然而,在功率与效率层面,其表现有所局限——它不具备可调功率的功能,整体效率较低且安全性能不尽如人意。

从设计角度来看,当前对TSA的优化工作重点集中在现有基础上的改进和提升上。在合适的操作区间内,最大输出功率密度大致维持在200-300W/kg,远低于动物肌肉达到的峰值。同时,TSA系统并未从根本上解决机器人面对外部冲击时所面临的零部件强度问题。

当前的研究工作主要聚焦于优化TSA的设计,以求实现性能提升与效率增强。

弹性驱动技术体系繁多,其设计及操控环节体现出高度的复杂性与多样性。生物体通过其巧妙的肌肉骨骼架构,在行动过程中实现能量的有效存储与释放,以精准地匹配不同时间点的能量需求与功率密度要求,进而增强关节的动力性能,并确保在着陆时具备缓冲能力。

1995年,麻省理工学院前瞻性推出了模仿人体肌肉系统功能的弹性驱动器,旨在赋予关节柔软、安全且高效能的特点。经过多年的技术演进,此技术现已发展出包括SEA、PEA、CEA和MEA在内的多种结构类型。

在工程应用中,弹性驱动器往往是在刚性执行元件基础上的串联或并联集成弹性材料。其力矩测量方式与传统的刚性传感器相似。然而,在控制系统的设计上,多数弹性驱动方案面临复杂性和精确度的挑战,这主要归因于引入了弹性体后所导致的欠驱动特性,为系统的控制带来了额外难度。尤其在机器人领域中,特别是用于腿部的驱动部分时,整个机器人的运动控制变得更加复杂和困难。

准直驱动系统是一种崭新且前沿的技术框架,其研发重点在于优化编码器与电机的功率密度性能指标。然而,在工艺与技术的制约下,传统的直接驱动电动机在扭矩密度方面无法完全契合机器人应用的需求。鉴于此,Wensing 等专家于 2016 年引入了准直驱驱动器这一创新概念,通过融合高性能电机和低速比减速机制,旨在实现高带宽力控及优越的抗冲击性能。

继之而起的是 2023 年加州大学洛杉矶分校的研究团队,他们采用了相似的设计思路,并研发出了一款与特斯拉人形机器人设计截然不同的新型机器人结构。该系统的核心组件包括高扭矩密度电机、低速比减速器、编码器和控制板等关键部件。

在力矩检测方面,PA 采用电流环技术进行精确测量。从控制及效率的角度审视,PA 展现出极高的精度与能效水平。在安全性考量上,得益于其独特的反驱特性,PA 系统具备了出色的防护能力。

展望未来,PA 驱动器的研发趋势将聚焦于编码器技术的创新与电机功率密度的提升,旨在进一步优化系统性能并拓展其应用领域。

在考量动态系统的结构布局时,我们审视了两种类型的驱动技术:传统无刷电机与创新的直接驱动解决方案。在刚性驱动器中,设计通常采用高传动比减速器结合电机,通过直接连接至输出轴,其某些配置可能在电机端配备刹车装置,并于减速器与输出端间增设高刚度力传感器以提升性能。

相反地,准直驱驱动器则倾向于采用低传动比的高扭矩密度电机,这一设计特征赋予了输出端小惯量的特性。力矩测量策略上,前者基于电流或应变片式力矩传感器进行检测,而后者通过电流环检测技术实现。

从控制角度来看,刚性驱动器展现出相对简单的控制流程与高度精确度,相比之下,准直驱驱动器虽在实用性及简化设计上更具优势,但在精度方面较之传统方案略逊一筹。能量效率层面,前者因较高损耗导致效率较低,而后者通过优化设计实现了较高的能效。

就安全性而言,刚性驱动器的安全防护机制相对有限,但准直驱驱动器得益于其独特的反向驱动特性,从而提供了更为出色的保护性能。综上所述,无论是从系统布局、力矩测量、控制策略、能量特性和安全性考量出发,两种驱动方式均展示了各自在不同应用场景下的独特价值与优势,供决策时灵活选用。

文章推荐

相关推荐