基于强化学习的软体机械手控制器的持续策略蒸馏

Apr, 2024

基于强化学习的软体机械手控制器的持续策略蒸馏

Continual Policy Distillation of Reinforcement Learning-based Controllers for Soft Robotic In-Hand Manipulation

Lanpei Li, Enrico Donato, Vincenzo Lomonaco, Egidio Falotico

TL;DR通过引入Continual Policy Distillation（CPD）框架，该研究介绍了一种实现多功能控制器的方法，以用于四指软抓手对不同形状和大小的物体进行旋转操作的柔性机器人手。该框架利用策略蒸馏（PD）从专家策略向不断发展的学生策略网络传递知识，并集成样本回放方法以增强泛化能力和避免灾难性遗忘。研究结果表明，CPD框架在整合多个专家知识和实现多功能自适应手部操作任务方面具有较好的性能。

Abstract

dexterous manipulation, often facilitated by multi-fingered robotic hands, holds solid impact for real-world applications. soft robotic hands

发现论文，激发创造

从人类示范中学习软体机器手的熟练操作

本文介绍了一种基于物体为中心示范实现的，用于训练软机械手进行熟练操作的方法，该方法使用增强学习技术，提出了一种新的算法，允许我们混合和选择最可行的示范来学习在硬件上模仿。最后，我们将这种方法应用于RBO Hand 2上，并获得了开/关阀门，滑珠和抓取等任务的良好表现。

Mar, 2016

使用深度强化学习和演示学习复杂的手部操作技能

本研究展示了无模型深度强化学习可有效扩展到高维复杂操作任务，并通过少量人工演示显著降低样本复杂度，从而使学习具有与机器人体验几个小时相当的样本量，展示出非常自然的动作并且更加稳健。

Sep, 2017

学习灵巧的手中操纵

通过强化学习，我们使用模拟环境训练了一种可以使机器人手指进行多指协调、操纵物体并控制重力的新型算法，并且证明该算法可以成功地应用在实物机器人中，为机器人控制领域提供了新的解决方案。

Aug, 2018

深度强化学习下的灵巧操作：高效、通用和低成本

本文提出使用深度强化学习作为一种可扩展的解决方案，来掌握带有多指手的接触丰富行为，并展示使用模型自由的深度强化学习算法在现实世界中可以学习各种复杂的行为，同时可以通过少量的人类演示来加速学习。

Oct, 2018

通过快速电机适应实现手中物体的旋转

本文介绍了使用自适应控制器和动态调整策略训练的机器人手指智能旋转物体的方法，该方法只需要使用手指就可以对各种大小、形状和重量的物体进行旋转，具有很好的稳定性和自适应性，为机器人手部操作的研究提供了一个新思路。

Oct, 2022

基于图像的熟练操作：通过细化引导实现自主现实世界强化学习

本文提出了一种基于视觉的程序自由编程的方法，利用强化学习实现复杂多指手势下的实物操作，无需手动建模或奖励工程。

Dec, 2022

连续灵巧性：将灵巧策略链接起来实现长程操纵

基于强化学习的连续灵巧系统，通过链式连接多个灵巧策略来实现长期目标，克服了任务空间维度高和复杂的动力学组合的挑战，并且能够在现实世界中应用于装备有灵巧手的机器人。

Sep, 2023

基于估计器耦合的强化学习用于稳定纯触觉手内操纵

通过训练过程中将控制策略与状态估计器耦合，本文解决了将强化学习控制器和状态估计器简单组合的问题，实现了对具有挑战性的纯触觉、目标条件、手部重新定位任务的高性能，同时保持比端到端策略学习更好的可解释性优势。

Nov, 2023

探索因果世界：通过知识转移和课程学习增强机器人操纵能力

使用强化学习训练三指机械臂的复杂任务，通过fine-tuning和curriculum learning的知识迁移策略提高学习效率和效果，并研究两种学习策略的关键因素及其效果，以应用于更广泛的基于学习的工程应用。

Mar, 2024

强化学习方法在三指机械手灵巧操作中的基准测试

本研究针对强化学习（RL）算法在真实环境中训练的挑战，探索了在可控且现实的设置中进行灵巧操作的直接训练。通过基准测试三种RL算法在复杂手持操作任务中的效果，结果展示了RL训练在实际应用中的实用性及相关挑战，为机器人领域的研究者和从业者提供了宝贵的经验和启示。

Aug, 2024