分层强化学习中鲁棒的知识传递

Feb, 2023

Robust Knowledge Transfer in Tiered Reinforcement Learning

Jiawei Huang, Niao He

TL;DR本文研究分层强化学习的并行传输学习框架，提出了新的在线学习算法以及转移来源选择机制来实现对高层任务的常数后悔性，在多低层任务的情况下也能获得更大的状态行为空间的利益。

Abstract

In this paper, we study the tiered reinforcement learning setting, a parallel transfer learning framework, where the goal is to transfer knowledge from the low-tier (source) task to the high-tier (target) task to reduce the exploration risk of the latter while solving the two tasks in

tiered reinforcement learning parallel transfer learning exploration risk online learning algorithms transfer source selection mechanism

发现论文，激发创造

基于多源转移学习的深度模型强化学习

本研究旨在提出多源模块化转移学习技术，以减少强化学习所需的环境交互次数并提高知识重用。我们支持这一技术的有效性，并进行了广泛而具有挑战性的视觉控制跨领域实验。

May, 2022

自适应策略转移的高效深度强化学习

本研究提出了一种名为 “Policy Transfer Framework” 的框架，该框架采用多策略转移方式对强化学习中的目标策略进行直接优化，可以很方便地与现有的深度强化学习方法相结合，实验结果表明，该框架明显加速了学习过程，并在离散和连续动作空间中超越了现有的策略转移方法，具有较高的学习效率和最终性能。

Feb, 2020

基于相似度的知识转移用于跨领域强化学习

通过开发半监督对齐损失来匹配不同空间的一组编码器 - 解码器，本研究研究了如何衡量跨领域强化学习任务之间的相似性，以选择能够提高学习代理性能的知识源。实验结果表明，在各种 Mujoco 控制任务中，我们的方法能够有效地选择和传递知识，而无需与专家策略相匹配、配对或收集数据的监督。

Dec, 2023

强化学习任务状态对应关系的学习，用于知识迁移

该研究提出了一种基于生成对抗网络模型的一对一转移学习方法，旨在解决深度强化学习中新任务的知识重用和泛化问题。

Sep, 2022

接触丰富操作中的强化学习知识迁移

本文介绍了一种基于多个技能先验的强化学习方法，通过学习每个任务所需技能的先验分布，并将任务的相似性与先前的任务进行比较，以指导在新任务上学习策略，从而更好地推广到训练中从未遇到的新任务。

Sep, 2022

注意力多任务深度强化学习

本文提出了一种基于注意力机制的多任务深度强化学习方法，该方法可以自动将任务知识分组，并在可能的情况下实现积极的知识转移，避免任务干扰，并表现出可比较或优越的性能。

Jul, 2019

跨领域强化学习的知识迁移：系统综述

通过对跨领域强化学习的了解和分类，以及对数据假设需求进行特征分析，本文全面系统地介绍了不同领域知识传递方法的研究，讨论了交叉领域知识传递的主要挑战以及未来研究方向。

Apr, 2024

通过撤销映射形式主义进行迁移强化学习

提出了一个名为 TvD 的框架，通过分布匹配实现智能体在交互域之间的知识转移，其基于优化目标推导出了一种新的策略更新机制，该机制可以有效地解决任务差异性的影响。

Nov, 2022

强化学习领域中的在线迁移学习

本文提出了一种在线传输框架来捕捉代理之间的交互，并显示强化学习中的当前传输学习是在线传输的一种特殊情况。此外，本文将现有的代理 - 代理方法重新定位为在线传输，并分析了其中一种教学方法的三种方法。最后，还有理论结果的经验验证。

Jul, 2015

多智能体强化学习中的无专家在线迁移学习

本文介绍了一种名为 EF-OnTL 的无专家自动选择知识传递源和知识传递方式的算法，以及一种名为 sars-RND 的方法来提高不确定性估计，通过在 Cart-Pole，mt-pp 和 HFO 数据集上进行的实验，证明了该算法相对于无传递情景的改善。

Mar, 2023