主动采样学习多任务

Feb, 2017

Learning to Multi-Task by Active Sampling

Sahil Sharma, Ashutosh Jha, Parikshit Hegde, Balaraman Ravindran

TL;DR提出了一个高效的多任务学习框架，该框架采用主动学习原则来解决多个目标导向任务的问题，通过对 7 个多任务实例进行测试，实现了竞争性的多任务表现。

Abstract

One of the long-standing challenges in artificial intelligence for learning goal-directed behavior is to build a single agent which can solve multiple tasks. Recent progress in →

artificial intelligence multi-task learning goal-directed behavior active learning atari 2600

发现论文，激发创造

一步主动学习的元学习方法

本文研究了代价昂贵的标注问题，并提出了一种使用元学习技术来学习主动学习策略的模型，在池化的场景下使用。实验获得了鼓舞人心的结果。

Jun, 2017

元学习的自适应任务采样

这篇论文提出了一种基于类对潜力的贪心采样方法，以改善元学习中的少样本分类问题的普适性表现。

Jul, 2020

Actor-Mimic: 深度多任务和转移强化学习

本研究提出了一种名为 “Actor-Mimic” 的多任务学习和迁移学习方法，通过深度强化学习和模型压缩技术来训练一个单一的策略网络，并通过多个专家教师的指导来学习在不同任务中的行为，并使用先前的知识解决新任务。研究结果表明，该方法的表征能力可以通过无先验的专家指导来推广到新的任务并加速学习。本方法可以应用于多样的问题，为了说明其效果，我们在 Atari 游戏上进行了测试。

Nov, 2015

一次性模仿学习

本文旨在提出一个元学习框架，称之为一次学习，实现机器人从极少量的演示中学习，并即刻推广到相似的其他任务中。

Mar, 2017

基于图的多任务学习：一种分布式、流式机器学习方法

本文是多任务学习的一篇综述，主要介绍了在分布式数据和网络系统上学习多个相关任务的新策略以及合作规则如何促进不同任务相关性模型，同时也解释了如何和何时合作的方式比非合作的策略更有效。

Jan, 2020

在线巴累托最优决策中的主动推理

本研究旨在引入一种新颖的多目标强化学习框架，确保任务的安全执行，优化目标之间的权衡，并符合用户的偏好。该框架包含两个主要层次：多目标任务规划器和高层选择器。通过案例研究和基准测试，证明了我们的框架在操作和移动机器人方面优于其他方法，并且能够学习多个最优权衡解决方案，符合用户的偏好，并允许用户调整优化权衡的平衡。

Jun, 2024

通过价值分歧进行自动课程学习

通过提出自动课程设计和目标建议模块，来提高强化学习中的多任务目标采样效率，并在机器人和导航任务中展示了比现有方法更好的性能。

Jun, 2020

活跃的多任务表示学习

本文提出了一种基于主动学习技术的算法，用于估计每个源任务与目标任务的相关性并进行采样，以便更好地利用大数据源任务的力量并克服目标任务样本的稀缺性，并证明了在线性表示类上使用我们的算法可以在相同错误率下节省源任务采样复杂度。同时，作者通过实验结果显示了该方法在真实的计算机视觉数据集上的有效性。

Feb, 2022

概率主动元学习

这篇论文提出了一种基于概率潜变量模型的任务选择方法，将任务的先前经验引入到元学习算法中，以提高元学习的数据效率，并在机器人实验中获得了实证证据。

Jul, 2020

PopArt 多任务深度强化学习

该研究智能体如何在一次学习过程中掌握多个顺序决策任务。作者们提出一种自适应方法，使每个任务对学习过程的影响基本相同，并在 57 个不同类型的 Atari 游戏中取得了优异的表现，学习了一个超越人类表现的单一训练策略。

Sep, 2018