多任务软选项学习

Apr, 2019

Multitask Soft Option Learning

Maximilian Igl, Andrew Gambardella, Jinke He, Nantas Nardelli, N. Siddharth...

TL;DR介绍了 Multitask Soft Option Learning (MSOL) 的一个层次化多任务框架，基于 Planning as Inference。使用单独的变分后验为每个任务提供正则化，并通过共享先验正则化实现。MSOL 通过避免训练过程中的不稳定性提供了软选项的概念，并为使用新任务的选项进行微调提供了自然方式，同时不会忘记其学习的策略。相比于分层和平面的迁移学习基线，MSOL 在实践中表现出更好的性能。

Abstract

We present multitask soft option learning(MSOL), a hierarchical multitask framework based on planning as inference. MSOL extends the concept of options, using separate variational posteriors for each task, regula

multitask soft option learning hierarchical multitask framework planning as inference intra-option policies transfer-learning

发现论文，激发创造

多任务选项学习与发现在随机路径规划中的应用

应用强化学习模式下，通过数据驱动方法生成抽象状态，计算有效的选项和高级实现路径，从而获得可执行和可解决性的强大保证。

Sep, 2022

学习抽象选项

通过构建一个层次化的选项体系，我们扩展了 Bacon 等人 2017 年的研究成果，提出了一种新的深度选项体系架构，并在离散和连续环境中进行了实证研究。

Oct, 2018

一种在高级和低级学习中可证明高效的基于期权的算法

在 Hierarchical Reinforcement Learning 的框架下，本研究通过使用不同的时间抽象层次交替使用相关算法，提出了一种用于解决有限时间间隔问题的元算法，从而初步理解了高层和低层策略同时学习的实际场景。

Jun, 2024

软模块化的多任务强化学习

通过引入显式的模块化技术和路由网络，将多任务共享的参数进行重新配置，实现了适用于连续任务的软模块化方法，从而大幅提高了机器人操作任务的效率和性能。

Mar, 2020

多任务学习与多任务优化

本文提出了一种多目标优化的多任务学习方法，通过迭代传递模型参数在优化过程中解决存在冲突的多个任务，并在图像分类、场景理解和多目标回归问题中进行了实验验证，结果显示该方法显著提升了发现满足 Pareto 优化的模型集合的状态，尤其在大规模图像数据集上的实验中，比现有技术取得了近两倍的超体积收敛速度。

Mar, 2024

选项的强化学习

目前的论文旨在探索强化学习领域，并在现有方法的基础上构建改进方法，以解决高维度和复杂环境中的学习问题。它通过分层的方式（称为层次强化学习）来分解学习任务，通过构建自主地学习层级结构的代理来提高效果。

Mar, 2024

在线结构化元学习

提出了一种在线结构化元学习（OSML）框架，该框架通过元分层图形式显式解开元学习器，通过不同的知识块构建元知识路径，从而使模型能够快速适应新任务并吸收新知识。通过在三个数据集上的实验，证明了该框架在同质性和异质性任务上的有效性和可解释性。

Oct, 2020

多智体深度探索覆盖选项

通过 HA-MSAC 和协同机制来构造多智能体协作选项并提高协作效率和任务奖励。

Oct, 2022

多任务学习的多目标优化

本论文将多任务学习作为多目标优化来解决，并提出了一种基于梯度下降优化算法的上限边界，证明了在现实情况下优化这个上限边界将得到帕累托最优解，在多任务深度学习问题上应用我们的方法表现出比最近的多任务学习公式或每项任务训练的模型更高的性能。

Oct, 2018

通过元学习子目标发现选项

使用元梯度法发现多任务强化学习环境中有用的选项的新方法，该方法使用一个管理器将发现的任务选项和基本操作结合在一起，并通过神经网络优化子目标的奖励和终止函数，实验证明该方法可以在学习过程中快速发现有意义和多样化的时间扩展选项，并且帮助初学者的学习速度更快。

Feb, 2021