- AAAI解放已见类别:通过锚点生成和分类重构提升少样本和零样本文本分类
我们提出了一个简单而有效的策略,通过利用大型预训练语言模型生成伪新样本并选择最具代表性的样本作为类别锚点,将多类分类任务转换为二元分类任务,并使用查询 - 锚点对的相似性进行预测,从而在少样本和零样本任务中充分利用有限的监督信号,实现模型从 - 从指令到约束:与自动约束验证的语言模型对齐
使用者对齐是将通用语言模型(LMs)调整为下游任务所必不可少的,但人工注释往往无法涵盖所有类型的指令,尤其是具有定制约束的指令。本研究提出了一种统一框架 ACT(Aligning to ConsTraints),通过约束验证器自动产生用户对 - WWW利用图神经网络进行节点消歧的分类
我们研究了图神经网络中的歧义问题,分析了歧义在不同图区域的存在以及与节点位置的关系,提出了一种新方法,使用额外的优化指导增强表示学习,并通过拓扑感知的对比学习来消除节点嵌入的歧义,从而有效解决歧义问题。实证结果验证了该方法的有效性,并突显其 - 复杂系统导航:通过扩展窗口匹配实现无损图图缩减
通过使用课程学习策略和扩展窗口匹配技术,本文尝试进行无损图稀疏化,并设计了一种损失函数来从专家轨迹中提取知识,理论分析证明了方法的合理性,并通过广泛实验证实其优越性。
- 历史感知的对话密集检索
通过上下文消噪的查询重构和根据历史转折的实际影响自动挖掘监督信号,提出了一种历史感知对话稠密检索系统,实验证明了 HAConvDR 在长对话中具有改进的历史建模能力。
- 外部引导下的图像聚类
本文提出了一种新的聚类方法(TAC),利用外部知识作为一种新的监督信号来引导聚类,同时采用了文本和图像模态的相互作用,通过跨模态邻域信息相互影响来改进图像聚类性能。实验证明,TAC 在包括全面的 ImageNet-1K 数据集在内的五个广泛 - FPDM: 使用文档级元数据的领域特定快速预训练技术
本研究提出了一种名为 FPDM 的快速预训练技术框架,利用文档元数据和特定领域的分类体系作为监督信号,以此来预先训练领域特定语料库上的变形金刚编码器,其中在域特定预训练期间,通过使用句子级嵌入作为输入来连续预先训练开放域编码器(以适应长文档 - ACL面向任务型对话的多粒度知识检索
通过引入多层级的知识检索器 MAKER 及一种新的蒸馏目标和监督信号,对话系统中的知识检索与响应生成解耦,从而有效地检索大规模的知识库。
- 自然语言理解中的即时数据增强去噪
本文介绍了一种基于原始数据集更清洁的假设,利用有机教师模型提供的软增强标签进行学习的数据增强即时去噪方法,并应用简单的自正则化模块来防止在噪声标签上过拟合,该方法可应用于各种数据扩充技术,可以在文本分类和问答任务中提高性能。
- 监督信号信息化程度的研究
通过对比学习和分类等几种常用的监督信号的信息论分析,我们确定了它们如何为表示学习性能做出贡献以及在训练数据集的标签数、类数和维数等培训参数影响下学习动力学如何受影响。我们通过一系列模拟实验进行了实证验证,并进行了成本效益分析,以建立一条权衡 - SIGIR知识图谱对比学习用于推荐
提出了一种知识图谱对比学习的框架 (KGCL),该框架通过知识图谱增强模式减少了噪声,利用交叉视图对比学习技术进一步抑制了噪声,实现了在稀疏、长尾和有噪声的知识图谱场景下的强大性能。
- 学习使用辅助单目上下文有助于单目三维物体检测
该论文提出了一种不需要额外信息的单目 3D 物体检测方法 MonoCon,利用辅助任务学习单目上下文来帮助检测,在训练中利用了一组丰富的二维监督信号来学习辅助参数,该方法在 KITTI 基准测试中在车辆类别上实现了最佳表现,并获得了较高的检 - CVPRCDGNet: 基于类分布引导的人体解析网络
本文提出了一种基于水平和垂直方向上的人体部位标签累计得到的实例分类分布来进行人体解析的方法,将这些分类分布引入神经网络模型的训练中,结合两个引导特征形成精确定位人体部位的空间引导图,并在几个公共图像数据集上表现了比其他方法都优秀的成果。
- CVPRFrameExit:面向高效视频识别的条件式提前退出
本文提出了一种条件早期退出框架,它采用简单的采样策略和级联的门控模块来自动决定处理最早推理的时点,在需要的情况下提供实时监督信号来提供精度和计算成本之间的动态权衡,以实现高效的视频识别。该方法在三个大规模视频基准测试中均优于竞争方法,在 A - WSDM通过学习中间监督信号提高多跳知识库问答
该研究提出一种新的师生网络方法来解决多跳知识库问答(KBQA)中中间缺乏监督信号的问题,利用前后向推理设计师网络产生更可靠的中间监督信号,并在三个基准数据集上展示了算法的有效性。
- 基于图的半监督学习的对比与生成图卷积网络
本文提出了一种新颖的基于图卷积网络的 SSL 算法,通过利用数据相似性和图结构来丰富监督信号,从而改善了现有方法的性能。该算法通过设计半监督对比损失和图生成损失提取潜在的关系,并在各种实际数据集上取得了显著的分类性能,与现有最先进的方法进行 - Kungfupanda 于 SemEval-2020 12 任务:基于 BERT 的多任务学习用于冒犯性语言检测
本篇研究论文针对社交媒体中的攻击性内容建立一个结合多任务学习和以 BERT 为基础的模型的系统,利用预训练的 BERT 语言模型有效地学习社交媒体中包含噪音的文本的表示,同时利用其他相关任务的监督信号来提高攻击性语言检测的性能,在 Offe - KDD通过实例加权利用补充的最后话语选择提升多轮响应选择模型
利用资源本身的相关性析出不同类型的监督信号来降低训练数据噪声对响应模型性能的影响,通过主任务 - 互补任务对将互补任务输出转换为主任务实例的权重值,对话系统响应选择模型得到了显著提高,并在两个公共数据集上进行了全面的实验。
- CVPR主动式物体操纵有助于视觉物体学习:一项自我中心视觉研究
本研究通过收集儿童的第一人称图像来分析他们所接受到的训练数据,并就儿童如何通过手操作物体来控制所接受到的监督信号进行探究。实验结果表明,通过手控制监督信号比没有手的效果更好,并且即使只有少量图像可用,这种趋势是一致的。
- Retina U-Net:基于分割监督的医学目标检测方法
本文提出了一种新颖的 Retina U-Net 结构,以提高小型医学图像数据集中目标检测效率,该结构自然地将单级探测器与医学图像语义分割中广泛使用的 U-Net 架构相结合,并通过补充对象检测与语义分割形式的辅助任务来重新捕获监督信号,从而