Feb, 2017
主动采样学习多任务
Learning to Multi-Task by Active Sampling
Sahil Sharma, Ashutosh Jha, Parikshit Hegde, Balaraman Ravindran
TL;DR提出了一个高效的多任务学习框架,该框架采用主动学习原则来解决多个目标导向任务的问题,通过对 7 个多任务实例进行测试,实现了竞争性的多任务表现。
Abstract
One of the long-standing challenges in artificial intelligence for learning
goal-directed behavior is to build a single agent which can solve multiple
tasks. Recent progress in →
发现论文,激发创造
Actor-Mimic: 深度多任务和转移强化学习
本研究提出了一种名为 “Actor-Mimic” 的多任务学习和迁移学习方法,通过深度强化学习和模型压缩技术来训练一个单一的策略网络,并通过多个专家教师的指导来学习在不同任务中的行为,并使用先前的知识解决新任务。研究结果表明,该方法的表征能力可以通过无先验的专家指导来推广到新的任务并加速学习。本方法可以应用于多样的问题,为了说明其效果,我们在 Atari 游戏上进行了测试。
Nov, 2015
基于图的多任务学习:一种分布式、流式机器学习方法
本文是多任务学习的一篇综述,主要介绍了在分布式数据和网络系统上学习多个相关任务的新策略以及合作规则如何促进不同任务相关性模型,同时也解释了如何和何时合作的方式比非合作的策略更有效。
Jan, 2020
在线巴累托最优决策中的主动推理
本研究旨在引入一种新颖的多目标强化学习框架,确保任务的安全执行,优化目标之间的权衡,并符合用户的偏好。该框架包含两个主要层次:多目标任务规划器和高层选择器。通过案例研究和基准测试,证明了我们的框架在操作和移动机器人方面优于其他方法,并且能够学习多个最优权衡解决方案,符合用户的偏好,并允许用户调整优化权衡的平衡。
Jun, 2024
活跃的多任务表示学习
本文提出了一种基于主动学习技术的算法,用于估计每个源任务与目标任务的相关性并进行采样,以便更好地利用大数据源任务的力量并克服目标任务样本的稀缺性,并证明了在线性表示类上使用我们的算法可以在相同错误率下节省源任务采样复杂度。同时,作者通过实验结果显示了该方法在真实的计算机视觉数据集上的有效性。
Feb, 2022
PopArt 多任务深度强化学习
该研究智能体如何在一次学习过程中掌握多个顺序决策任务。作者们提出一种自适应方法,使每个任务对学习过程的影响基本相同,并在 57 个不同类型的 Atari 游戏中取得了优异的表现,学习了一个超越人类表现的单一训练策略。
Sep, 2018