这篇论文提出了一种基于概率潜变量模型的任务选择方法,将任务的先前经验引入到元学习算法中,以提高元学习的数据效率,并在机器人实验中获得了实证证据。
Jul, 2020
通过选择多样的任务进行小批量处理,我们研究利用任务关联的外部知识来改善训练稳定性,进而减少训练中的噪音。
Dec, 2023
本文提出一种在元强化学习中用于解决任务信息受限问题的方法,通过利用各种特权信息,分别学习策略和任务信念来解决部分可观测马尔可夫决策问题,从而在元强化学习环境中较为有效地解决标准问题和需要长期记忆的复杂连续控制问题。
May, 2019
本研究提出了一系列用于强化学习的无监督元学习算法,以解决通过任务提案进行任务训练而非手动任务设计所带来的算法设计负担,并得出这些程序具有优异性能的结论。
Jun, 2018
本研究采用 meta-RL 控制策略,结合模型基于信息离线培训,通过已知系统的动态规律 (parameters) 来自动适应过程的变化,实现对一、二阶系统的调节。
Sep, 2022
通过信息理论设计的元正则化目标,可以使元学习器在任务训练数据和任务测试数据之间有效地适应,成功地使用来自非相互排斥任务的数据来有效地适应新任务,并在应用场景中大幅优于标准元学习算法。
Dec, 2019
本研究提出了一种 meta-RL 方法,通过捕捉不同任务之间的共享信息和快速抽象任务特定信息的能力,使用任务编码器生成任务嵌入并在所有任务之间共享策略,实现在训练和新任务上的更好学习能力和更高回报率。
在这篇论文中,我们开发了一种可扩展的基于高斯过程的模块化元学习模型 ScaML-GP,其中的核心贡献是一个经过精心设计的多任务核函数,它实现了层次化训练和任务的可扩展性。通过在元数据上对 ScaML-GP 进行条件化,我们揭示了其模块化特性,得到一个结合了元任务高斯过程后验的测试任务先验。在合成和真实世界的元学习实验中,我们证明了 ScaML-GP 可以在少量和大量元任务中高效学习。
本篇研究了如何在少量标记数据的情况下进行监督学习,通过元学习来利用相似性,结合谱方法,提出了一种优雅的方法来充分利用小型数据集,只需适量的中型数据即可使大数量小标记数据的任务替代大数据任务。
Feb, 2020
利用相互信息和信息瓶颈的概念对元学习进行了建模,提出了一种通用的可行的框架,用于学习任务描述的随机表示或编码,该表示对于预测验证集具有高度的信息量,并开发了一种基于记忆的算法,用于少样本分类问题的研究。
Sep, 2020