显著性正则化深度多任务学习

KDDJul, 2022

Saliency-Regularized Deep Multi-Task Learning

Guangji Bai, Liang Zhao

TL;DR该论文提出了一种新的多任务学习框架，通过补充现有的浅层和深度多任务学习场景的优势，联合学习潜在特征和显式任务关系。同时，通过新的正则化器显式地学习任务关系。理论分析表明，该方法降低了泛化误差，实验表明该方法是有效的、高效的并且合理的。

Abstract

multitask learning is a framework that enforces multiple learning tasks to share knowledge to improve their generalization abilities. While shallow →

multitask learning latent features task relations regularizer generalization abilities

发现论文，激发创造

稀疏扩散策略：一种稀疏、可重复和灵活的机器人学习策略

通过引入稀疏的、可重用的、灵活的策略 Sparse Diffusion Policy（SDP），在传统模型中解决了多任务学习和持续学习的高计算成本和灾难性遗忘的挑战，SDP 通过采用基于 transformer 的扩散策略中的 experts 和 skills，实现了选择性激活专家和技能，在不重新训练整个模型的情况下实现了高效的任务特定学习，减少了激活参数的负担，并促进了不同任务中专家的无缝集成和重用，通过对多样任务的广泛实验验证了 SDP 在多任务场景中的优越性，防止了对新任务的遗忘，实现了高效的任务转移，为先进的机器人应用提供了有前景的解决方案。

Jul, 2024

利用注释者的主观性进行鄙视行为识别的多任务学习框架

使用人工智能技术识别厌女症是一种打击网络对女性的有害言论的方式。本文中，我们提出了一种多任务学习方法，利用主体性解释厌女症的主题来提高识别系统性别歧视内容的性能。通过结合不同注释者的多样性观点，考虑六个配置文件组的性别和年龄，在模型设计方面进行了广泛实验和错误分析，并使用两种语言模型验证了我们提出的四种替代的多任务学习技术设计来识别英文推文中存在的厌女症内容。结果表明，结合多样化的观点增强了语言模型解释不同形式厌女症的能力。此研究推进了内容辅助管理，并强调了拥抱多元观点来构建有效的在线管理系统的重要性。

Jun, 2024

布朗非局域神经元与激活函数

在本文中，我们通过定义非局部方向导数的新概念，并分析其理论属性，推导出非局部导数是 ε-sub 梯度的概率重整结果，以及收敛于随机梯度下降方法的样本复杂度结果。最终，利用非局部梯度解决了图像关节流形上参数估计的高度不可微和非凸模型问题，并通过实验表明了在低训练数据情况下，使用布朗运动灌注的 ReLu 激活函数和非局部梯度胜过确定性的 ReLu 激活函数的优越的泛化能力。

Jun, 2024

基于深度强化学习的自动规划中的目标选择学习

提出了一种具备学习选择子目标的规划和行动架构，可以在面对有实时限制的场景时减轻规划器的负载。在视频游戏环境中训练了这种架构，并通过测试同一游戏的不同关卡来评估其泛化能力。结果表明，与其他方法相比，该模型在计划质量（计划长度）和时间要求方面表现更好，既比标准的深度 Q 学习更具样本效率，又可以更好地泛化到不同的关卡，同时较现有最先进的自动规划器缩短问题解决时间，但相应地得到的计划行动增加了 9%。

Jun, 2024

不消除而是综合：对混合专家进行事后控制以应对自然语言理解中的快捷转移

通过对混合专家的悲观聚合，可以增强模型对快捷方式分布变化的鲁棒性。

Jun, 2024

FlexCare: 灵活的多模态健康预测中利用交叉任务协同

提出了一种名为 FlexCare 的统一医疗预测模型，可以灵活地处理不完整的多模态输入，改善对多个医疗任务的适应性。该模型通过将多任务预测分解为一系列异步的单任务预测来突破传统的并行多任务预测范式，并通过引入多模态信息提取模块和多模态融合模块，在考虑不同模态之间和不同任务之间的信息差异的基础上实现对全面多模态数据的利用。通过在多个任务上进行实验，并进一步分析，验证了该多任务策略在医疗领域的可行性和潜力。

Jun, 2024

通过多任务学习解开方言与社会偏见以提高公平性

方言、自然语言处理方法、偏见语言、公平性和多任务学习的关键字；使用多任务学习可以提高公平性，并更可靠地检测偏见语言的特性。

Jun, 2024

4D ASR: 联合波束搜索综合 CTC、注意力、转导和掩码预测解码器

我们提出了一种联合建模方案，通过多任务学习和三种新的单通道波束搜索算法，我们训练出的 4D 模型在端到端自动语音识别上取得了更好的性能，并超过了使用单个解码器的模型。

Jun, 2024

基于注意力机制的多模态数据顺序推荐系统

提出了一种基于多模态数据的关注机制的序列推荐方法，该方法利用图像、文字和类别等多模态数据，利用 attention 操作和多任务学习损失，提高了推荐系统的性能。

May, 2024

深度学习的核范数正则化

利用深度学习技术，通过惩罚函数的雅可比核范数，提出了一种简单高效而准确的规则化方法，使雅可比核范数可以应用于高维深度学习问题，并在去噪和表示学习等领域进行了实证研究。

May, 2024