- 辅助任务对表示动态的影响
本文研究了在稀疏奖励环境中,如何通过分析时间差分算法的动态来建立转移算符的谱分解和各种辅助任务诱导的表示之间的联系,并利用这些理论结果来选择深度强化学习代理的辅助任务。
- ICLR基于回报的对比表示学习在强化学习中的应用
本研究提出了新的辅助任务,通过回报信号,使得学到的表示区分具有不同回报的状态和动作对,从而可以更好地在 Atari 游戏和 DeepMind 控制套件等复杂任务中进行学习,并在与现有的辅助任务相结合时表现更好。
- ACL少量预训练大有裨益:针对低资源词形丰富语言的依存句法分析任务案例研究
本研究针对资源匮乏的语言环境下,针对高度分析形态的自然语言(MRLs)的依赖句法分析任务,提出了预训练的简单辅助任务方法,实验结果表明,提出的方法使得在 10 种低资源语言环境下实验得到了稳定的提高
- 最小数据学习的辅助任务重新加权
本文提出了一种自动重新调整辅助任务权重的方法,以减少主任务所需的培训数据,并在多个实验设置下证明了算法的有效性,同时避免昂贵的网格搜索。
- ICML时序学习的时间相关任务调度
本文介绍了一种可学习的调度程序,用于序列学习,可适应地选择辅助任务以提高主任务的性能,通过双层优化联合训练,实验证明该方法显着提高了同时机器翻译和股票趋势预测的性能。
- 辅助任务加速学习目标点导航
本论文通过使用自监督的辅助任务(例如,预测两个自我中心观察之间采取的动作,预测轨迹中两个观察之间的距离等),并使用注意力机制组合个任务得到的表示向量,成功地提高了 PointNav 任务的样本和时间效率,超过了以前的最新研究成果,并在 40 - 深度多任务学习和辅助任务学习简述
本文采用深度多任务学习方法,探究如何选择有用的辅助任务来提高模型性能和泛化能力。
- ICLR隐式微分辅助学习
本文提出了一种基于隐式微分的新框架 AuxiLearn,针对多任务学习中设计有用的辅助任务和将辅助任务组合成一个连贯的损失函数的挑战,当已知有用的辅助任务时,可以学习一个网络将所有损失合并成一个连贯的目标函数,并且能够学习任务之间的非线性交 - AAAI升值路径:走向更好的强化学习表征
通过对价值改善路径的整体近似,以增强价值函数逼近能力,提出了一种新的价值导向强化学习算法。通过在 Atari 2600 游戏中测试,该算法的性能得到了显著提高。
- CVPRS3VAE:自监督序列 VAE 进行特征解缕和数据生成
该论文提出了一种顺序变分自编码器,利用自监督方法,通过利用输入数据自身或外部模型提供的监督信号设计辅助任务,轻松将输入序列表示分解为静态因素和动态因素,并在视频和音频等领域的综合实验中证明其在表示分解和序列数据生成方面的有效性。
- 发现有用问题的辅助任务
这篇文章提出了一种基于元梯度的全局价值函数(GVFs)发现方法,从而让强化学习(RL)代理能够发现自身的问题并通过学习答案来获得未预期的有用知识和技能,在 Atari 2600 电子游戏中,这些辅助任务通过与主任务一起元学习的方式可以提高一 - AAAI深度强化学习的辅助任务 —— 代理建模
本文探讨了如何将演员 - 评论家(Actor-Critic)方法在深度强化学习中,尤其是异步优势演员评论家(A3C)与代理建模相结合。我们提出了两种体系结构来执行代理建模,旨在学习其他代理的策略作为辅助任务。在协作和竞争领域的实验结果表明, - ICML自我监督:探究交互环境中的自监督表示
在 Flappy Bird 和 Sonic The Hedgehog 两个视觉环境中,我们对自监督方法进行了小规模研究。我们定量评估了从这些任务中学到的表示,以及它们对新的情况(如新的关卡和纹理)的可推广性。最后,我们通过可视化它们关注的环 - ACLAutoSeM:多任务学习中的自动任务选择和混合
本文提出了 AutoSeM,一个两阶段多任务学习管道,第一阶段使用 Beta-Bernoulli 多臂赌博机通过 Thompson 采样自动选择最有用的辅助任务,第二阶段使用基于高斯过程的贝叶斯优化框架学习这些选定辅助任务的训练混合比,本文 - 基于注意力增强的端到端多任务学习在语音情感预测中的应用
本文提出了一种增强的端到端框架,通过学习其他辅助任务和关注机制来获取更加稳健和更好地共享表示,以缓解传统系统中由于有限训练数据而导致的过拟合问题,提高语音情感识别性能。
- 同时学习视觉和基于特征的控制策略,应用于现实世界的杯中球游戏
通过多任务强化学习方法,本文在真实机器人上实现了视觉导向控制策略的快速训练技术,并在模拟和真实世界的 Ball-in-a-Cup 游戏中进行了测试。
- 强化学习最优表示的几何视角
通过基于值函数空间的几何特性,提出了一种新的表征学习的视角,证明了值函数作为辅助任务的实用性并将敌对价值函数作为其自然候选。在四间房间领域的实验中,展示了敌对价值函数作为辅助任务的有用性和特点。
- 元辅助自监督广义化学习
该研究提出了一种自动学习辅助标签的新方法,通过训练标签生成网络和多任务网络来改善任何监督学习任务的泛化能力,并展示了 Meta AuXiliary Learning (MAXL) 方法自监督的优势,该方法不需要额外数据就能在 7 个图像数据 - 多任务学习中的辅助任务
通过在视觉数据集中引入小部分的附加任务,可以提高深度多任务卷积神经网络的性能,证实了辅助任务在加速训练和优化最终结果方面的有效性
- 深度神经网络中的多任务学习概述
本文概述了多任务学习在深度神经网络中的应用,介绍了常见的两种方法,并讨论了最新的进展,旨在帮助机器学习从业者理解多任务学习的原理并提供选择辅助任务的指南。