本文提出了一种名为CompILE的方法,通过无监督可微分序列分段模块学习顺序数据的潜在编码,从数据中学习可重复使用的,可变长度的分层行为,该模型通过分解潜在编码空间分离策略和分离策略的角色,能够学习连续的控制任务并在缺少任务特定策略时表现较优。
Dec, 2018
本研究提出了一种用于学习可重复使用的运动技能并将其组合为复杂行为的方法,该方法称为“可组合的原语”,可以将代理人的技能分解为基本元素,这些基本元素可以通过乘法组合同时激活,从而使基本元素能够相互传输和重组,以适应新任务的需要,并演示了该方法在模拟环境中提取可组合的技能并重用这些技能来解决连续控制任务的能力。
May, 2019
该研究旨在通过学习使用感知运动基元来解决复杂的长期规划操作问题,其需要将基本技能组合成新的技能来推广应用于广泛的问题中,同时使用高效的主动学习和采样方法,将学习和规划方法结合来规划各种复杂的动态操作任务。
Jun, 2020
提出了一种可验证和组合强化学习的框架,其中包含一组学习单独子任务的子系统,并填充入标准任务的高层模型,将各个子任务组合成全部任务,成功证明了该框架的实用性和有效性。
Jun, 2021
该研究提出了一种基于任务实体组成结构的框架和适当的策略设计,旨在解决通过目标配置来规范控制、机器人和规划的任务,此策略运用Deep Sets和Self Attention等结构,在模拟机器人操作任务的训练中,成功率更高且泛化能力更强。
Mar, 2022
本文提出了一种基于神经模块的组成式学习方式,探讨了在连续强化学习模型下的可重复利用子问题解决方案,并且通过离线重放经验保持表现以加速未来任务学习的累积神经组件复合持续强化学习方法。
Jul, 2022
本文介绍CompoSuite,一个开源的模拟机器人操作基准测试,用于对复合多任务强化学习进行基准测试,评估现有单任务、多任务和组合学习算法在不同训练设置下的能力,并评估它们对未见任务的组成归纳能力,以此暴露现有RL方法在组合性方面存在的缺陷及问题。
本文利用分类学的方法,构建了一个强化学习的可组合性框架,研究了分解问题为子任务并在这些任务上运用学习策略的方法。文章针对贝尔曼最优方程而研究在组合模型下的可行性,探讨使用一些纤维积和推出操作使得组合现象更明显,并且通过引入的zig-zag连线模拟了MDP中的连续式任务完成方式。
Aug, 2022
本研究探讨了改进多任务训练以及在强化学习环境中的传递的潜力,提出了一种参数组合的方法来处理这一挑战,并通过在不同的操作任务上进行传递实验以证明其有效性。
Jun, 2023
我们提出了一个可验证和组合的强化学习框架,其中一组强化学习子系统被组合起来以实现整体任务,子系统之间通过定义接口和部分可观察性相互交互。实验结果展示了该框架在各种环境中的新颖功能。
Sep, 2023