auxiliary tasks | BriefGPT - AI 论文速递

关键词auxiliary tasks

搜索结果 - 62

使用合成观测学习未来表示以提高效率的强化学习
通过丰富辅助训练数据，提出了一种无需训练的方法来合成可能包含未来信息的观察，从而改进了强化学习中的辅助表示学习，并展示了其在连续控制和基于无动作视频演示的视觉预训练中的先进性能。
PDFa month ago
FedAuxHMTL：网络边缘流量分类的联邦辅助硬参数共享多任务学习
该文介绍了一种新的联邦辅助硬参数共享多任务学习框架，名为 FedAuxHMTL，通过在边缘服务器和基站之间进行模型参数交换，使分布区域的基站参与到 FedAuxHMTL 过程中，并提升主任务 - 网络边缘流量分类的学习性能。通过实证实验证明
PDF3 months ago
提升双仿射语义依存分析的辅助任务
使用简单的辅助任务来增加语义依存分析（SDP）性能，对英语无环数据集和法语深层语法循环图进行实验，显示了在基于 Transformer 的上下文表示的接近最新技术基线上的有限但系统性能改善，从而提供了一种简单而稳健的提高 SDP 性能的方法
PDF5 months ago
医学图像分割的两阶段多任务自监督学习
医学图像分割使用深度学习技术取得了重大进展，然而医学应用中固有的数据稀缺性对深度学习的分割方法构成了巨大挑战。自监督学习通过从可用数据集中创建辅助学习任务，并利用解决这些任务获得的知识来更好地解决目标分割任务，提供了一种解决方案。本研究提出
PDF5 months ago
利用辅助学习和特定任务适应性增强分子性质预测
既训练的图神经网络（Pretrained Graph Neural Networks）广泛应用于各种分子属性预测任务，但由于传统的精调对目标任务的训练会导致较差的泛化性能，因此本文探讨了通过与多个辅助任务共同训练的方式来适应目标任务的预训练
PDF5 months ago
ACL大规模语言模型的环境化蒸馏用于知识图谱补全
通过引入上下文化蒸馏策略，将大型语言模型转化为更加丰富的上下文片段，进而通过引入定制的辅助任务，使得较小的知识图谱补全模型能够吸收这些丰富的三元组，并在各种数据集和知识图谱补全技术的综合评估中展现出卓越的性能提升和适应性，这为路径选择和适当
PDF5 months ago
SwapTransformer: 基于 OSHA 数据集的模仿学习高速公路超车战术规划模型
该研究聚焦于高速公路场景中的高层次决策问题，旨在改善高速公路上自动超车和变道的旅行辅助功能。研究提出了名为 SwapTransformer 的架构作为模仿学习方法，通过辅助任务来帮助模型更好地理解周围环境。实验结果表明，SwapTransf
PDF6 months ago
交互式自主导航与内部状态推断及交互度估计
通过引入空间 - 时间相关推理等辅助任务，将深度强化学习框架与神经网络结合，以提高智能代理（如自动驾驶车辆）在复杂场景中的决策性能和可解释性。首次通过推理和预测他人行为，确定他们对自身行为的影响程度，提供了详尽的中间指标用于决策制定。
PDF7 months ago
比较强化学习表征学习的辅助任务
生成表示在强化学习中得到了稳步流行，由于其在提高样本效率和许多环境中的回报方面的潜力。本文对常见的辅助任务进行了比较，基于数百个使用最先进的离策略强化学习算法训练的代理程序。发现显示，辅助任务的表示学习对于维度和复杂度较高的环境是有利的，并
PDF9 months ago
超参数化神经网络中多任务学习和微调的隐式正则化
通过研究辅助任务的学习，我们发现其对特征共享和任务特定特征的稀疏性进行了激励，同时提出了一种修改了预训练和微调方法以提高性能的技术。
PDF9 months ago
通过任务提示改进 Transformer 的长度泛化
使用任务提示的方法改善长度泛化问题，在经典的排序问题上验证了其有效性，并通过探测和可视化技术提出了模型学习行为的理论构建，进一步提高了模型在未知长度上的性能。
PDF9 months ago
为什么角边缘损失对半监督异常声音检测很有效？
通过实验证明，最小化角度边缘损失还可以最小化紧凑性损失，从而避免学习平凡的解决方案，同时还能教会模型适用于在嘈杂条件下检测异常声音的表示方法。
PDF9 months ago
ICCV辅助任务对基于 3D 骨架的人体运动预测的影响
通过引入辅助任务的模型学习框架，本文提出了一种新的方向，即通过捕捉时空依赖关系以实现坐标恢复，以及通过辅助任务促使辅助自适应变压器更好地学习特征，并通过实验证明了该方法的优越性。
PDF10 months ago
语音模型中的大写和交替预测注入方法
本研究通过使用文本注入算法来训练自动语音识别模型，以解决长尾数据的大写问题，并改善对话机器人中的交互转移预测。
PDFa year ago
递归隐式地图的目标导航
我们在这篇论文中提出了一种隐式空间地图的目标导航方法，使用 transformer 递归更新隐式地图，并通过辅助任务训练模型，以重构显式地图、预测视觉特征、语义标签和动作。我们的方法在挑战性的 MP3D 数据集上显著优于最先进方法，并且在
PDFa year ago
基于语义引导的基于 Transformer 的传感器融合用于改进航点预测
传感器融合在智能自驾代理中是关键，本文通过融合辅助任务和利用模仿学习来改进基础网络以提高道路导航的安全性和完整性。
PDFa year ago
ICCV盲目图像质量评估的测试时间适应
通过引入组对比损失和相对排序损失，使用测试分布中的少量图像批次可以显著提高模型性能，使盲目图像质量评估模型具备质量感知能力并适应目标数据。
PDFa year ago
通过共享特征建模的多模态学习中的缺失模态问题
本文提出了一种叫做 Shared-Specific Feature Modelling (ShaSpec) 的方法，旨在解决多模态任务中遗漏模态问题，并通过学习共享和特定特征来更好地表示输入数据。实验结果表明，ShaSpec 在医学图像分割
PDFa year ago
通过深度强化学习探究 Morris 水迷宫中的导航策略
本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序，并自动分类了导航策略，将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素，最后研究了人工代理神经网络中激活的内部表征的
PDFa year ago
任务引导提示学习在隐式话语关系识别中的应用
该研究提出了一种称为 TEPrompt 的任务启示式预测学习模型，通过融合三个相关任务的学习特征来识别不明确文本间关系，实验结果表明，TEPrompt 在 IDRR 中表现优于 ConnPrompt，并且能够通过辅助任务的联合训练来提高决策
PDFa year ago