深度强化学习中的迁移学习:综述
本文研究利用源任务采集的经验来加速强化学习算法的传递强化学习方法,介绍了在源任务与目标任务之间相似度的基础上适应转移过程的新算法,并在一个连续链问题中报告了描绘性实验结果。
Aug, 2011
本研究提出了一种名为“Policy Transfer Framework”的框架,该框架采用多策略转移方式对强化学习中的目标策略进行直接优化,可以很方便地与现有的深度强化学习方法相结合,实验结果表明,该框架明显加速了学习过程,并在离散和连续动作空间中超越了现有的策略转移方法,具有较高的学习效率和最终性能。
Feb, 2020
本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景,包括不同方向的方法和应用场景,重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。
Sep, 2020
提出了一个名为TvD的框架,通过分布匹配实现智能体在交互域之间的知识转移,其基于优化目标推导出了一种新的策略更新机制,该机制可以有效地解决任务差异性的影响。
Nov, 2022
本文介绍了transformers在reinforcement learning中的应用,包括表示学习、转移和奖励函数建模,策略优化等多个方面,并讨论了可视化技术和高效训练策略的应用,以提高transformers的解释性和效率。同时,讨论了transformers在不同领域的应用以及在reinforcement learning中的局限性和潜在突破。
Jul, 2023
通过一个综述性论文,我们统一了机器人学领域中的迁移学习概念,并提供了首个考虑机器人、任务和环境关键概念的分类法,同时也强调了在实现迁移学习的全部潜力方面最重要的障碍,包括迁移的不同抽象层级,迁移差距和质量的量化需求,以及负向迁移所带来的危险。希望通过本文引导学术界在实现机器人学中迁移学习的全部潜力方面集中努力。
Nov, 2023
当代人工智能系统的不断发展需要相应的资源、大量数据集和计算基础设施,特别是在限制环境下的基础研究和应用中,知识的表示通过各种模态呈现,包括动力学和奖励模型、价值函数、策略和原始数据。该论文系统地讨论了这些模态,并基于其固有属性和与不同目标和机制之间的相互关系来进行讨论,以实现知识的迁移和推广,并分析了特定形式的转移出现或稀缺的原因,并强调从设计到学习的转移的重要性。
Dec, 2023
通过对跨领域强化学习的了解和分类,以及对数据假设需求进行特征分析,本文全面系统地介绍了不同领域知识传递方法的研究,讨论了交叉领域知识传递的主要挑战以及未来研究方向。
Apr, 2024