- 循环就业者:面向多视角 3D 检测和跟踪的对象感知时序表示学习
我们提出了一个统一的面向对象的时间学习框架,用于多视角三维检测和跟踪任务。通过构建一个循环学习机制以提高多视角表示学习的鲁棒性,使模型预测的信息能够向后传播,从而减小历史帧中与目标无关的区域的响应,降低污染未来帧的风险并提高时间融合的对象感 - 小巧、多功能且强大:一种范围视图感知框架
通过新颖的多任务框架,利用纯卷积架构的小型、多功能、强大的(SVM)网络,提升了范围视图表达的 3D 检测性能,并在无需额外模块的情况下,无缝集成了语义分割和全景分割任务,取得了新的状态最佳检测性能。
- UniRetriever:多任务候选选择用于各种上下文自适应式会话检索
我们提出了一种多任务框架,作为会话中三个主要检索任务(个人选择、知识选择和回复选择)的通用检索器,通过设计一个双编码器体系结构来检索相关上下文,通过点积方法检索适合的候选项,并引入两个损失约束来捕捉对话上下文和不同候选项之间的微妙关系。实验 - 多任务预训练和图上提示的 MultiGPrompt
在本文中,我们提出了 MultiGPrompt,一种新颖的多任务预训练和提示框架,用于利用多个预设任务获取更全面的预训练知识,并通过预设和全局提示指导少样本情境下的后续任务。我们进行了六个公共数据集上的大量实验来评估和分析 MultiGPr - 识别情绪之间的条件因果关系及其相应条件
确定是否在不同的上下文范围内表达出的情绪和原因具有有效的因果关系,并提取参与因果关系的特定上下文从而构建一个可用于平衡具有和没有因果关系的文档数量的最终数据集,通过提出上下文屏蔽模块来提取参与因果关系的上下文子句,并通过提出预测聚合模块根据 - MedPrompt:跨模态提示多任务医学影像翻译
跨模态医学图像翻译是合成临床诊断中缺失模态数据的必要任务。本研究提出了 MedPrompt,一种多任务框架,可以高效地翻译不同模态。通过引入自适应提示块、提示提取块和提示融合块,我们能够有效地编码跨模态提示。通过集成 Transformer - 基于多任务学习使用移动感知技术进行罕见生活事件检测
本文提出了一种基于移动传感器数据来检测罕见生活事件的多任务框架,通过使用格兰杰因果性和无监督自编码器以及辅助序列预测器来提高检测准确性,结果显示该方法的 F1 值达到了 0.34,表现优于多个基线,结果为罕见事件检测提供了有效的方法。
- 使用多任务学习进行公平普适化,无需使用人口统计信息
本研究提出了基于多任务框架的公平性训练方法,通过对相关任务中的人口统计数据进行利用,减少目标任务中的偏差,即使在没有内部统计数据的情况下也可以提高公平性。
- 语义边界辅助的语义分割
本文提出了 Semantic Boundary Conditioned Backbone (SBCB) 框架,该框架是一种简单而有效的训练框架,旨在提高分割性能,尤其是在边界周围,可用于改善各种流行分割头和骨干网络。
- 利用多个 TTS 目标提升语音翻译
通过分析不同合成目标语音对直接语音翻译模型的影响,本文提出了一个多任务框架,通过同时优化不同 TTS 系统的多个目标来提高 S2ST 表现,在 Fisher 西班牙语 - 英语数据集上实现了 2.8 BLEU 的一致改善效果。
- 话语 MOS 多任务学习与评分者偏差校正
本文提出了一种多任务框架来改进盲目 MOS 评估模型的性能,通过在训练中加入附加标签和数据,结合两个不连续的数据集来联合估算 MOS、混响时间和清晰度,并使用半监督框架来组合两个 MOS 数据集以解决评估者偏差。
- 一种基于情感感知的多任务迁移学习方法,用于虚假新闻和谣言检测
本文提出了一种基于情感分类的多任务框架,利用迁移学习技术标记四个假新闻检测和谣言检测数据集,并证明了情感与假新闻和谣言检测的合法性的相关性,进而提供了一种改进的特征提取方法。实验结果证明,该多任务模型在准确性、精确度、召回率和 F1 分数方 - Seg4Reg+: 脊柱分割和 Cobb 角度回归之间的一致性学习
本文提出了一种名为 Seg4Reg+ 的多任务框架,通过优化分割和回归网络,探索了它们之间的局部和全局一致性以及知识迁移,并在公共数据集上进行了评估,证明了其在 Cobb 角估计方面的有效性和卓越表现。
- MGNet: 自动驾驶的单目几何场景理解
MGNet 是一个用于单目几何场景理解的多任务框架,结合了全景分割和自监督单目深度估计两个任务,旨在提供低延迟、实时单 GPU 推理,实现单高分辨率摄像头图像的密集 3D 点云和实例感知语义标签。研究人员在 Cityscapes 和 KIT - 情感识别和生成对话的统一框架
本文提出了一种多任务框架,该框架联合识别对话的情感并根据所识别的情感生成响应,我们利用基于 BERT 的网络来创建一种共情系统,并使用混合目标函数来训练端到端网络,包括分类和生成损失函数,实验结果表明,我们的多任务框架优于现有的最先进模型。
- SIGIR跨域合同元素双向反馈子句 - 元素关系网络提取
提出了一种用于跨域合同元素提取的框架,Bi-FLEET,通过构建跨域子句元素图和采用分层图神经网络来维护与子句和元素类型相关的不变知识,设计具有双向反馈结构的多任务框架,同时进行子句分类和元素提取,实现合同元素自动识别和提取,大幅减少人工成 - SIGIR从多任务角度理解情感维度在推特情感检测中的作用
提出了一种多任务框架 VADEC,用于更好地进行情感分析,其中包括多标签情感分类和多维情感回归,并通过协同训练利用任务之间的相互关系,其性能超过了最强基线,尤其是在情感分类任务方面,为 AIT 数据集中的 Jaccard Accuracy、 - CVPR基于图形的人物签名重识别方法
本文提出了一种新的方法,将细节人物描述(属性标签)和视觉特征(身体部位和全局特征)聚合成一个图形,即基于图形的人物签名,并利用图形卷积网络学习人物视觉签名的拓扑结构,并将其集成到多支路多任务框架中用于人物重新识别,并在两个大规模数据集上展示 - 灵活的分段曲线估计在照片增强中的应用
本文介绍了一种名为 FlexiCurve 的新方法用于照片增强,该方法相对于现有方法具有更高的效率和灵活性。
- EMNLPN-LTP: 一个用于中文的开源神经语言技术平台
本文介绍了 exttt {N-LTP},这是一个开源神经语言技术平台,支持六种基本的中文自然语言处理任务,采用多任务框架和知识蒸馏方法,提供易于使用的 API 和可视化工具,以便更方便地使用和查看处理结果。这是第一个支持六种中文 NLP