- 连接显著性预测与图像质量评估之间的差距
过去几年中,深度神经模型在图像质量评估 (IQA) 方面取得了显著进展,但由于深度神经网络的复杂性,其成功的原因仍不清楚。本文通过进行实证研究揭示了 IQA 和 Saliency Prediction 任务之间的关系,证明了前者包含了后者的 - COLING自动事实验证解释评估框架的探索
深度神经模型在自然语言处理中变得越来越复杂且难以解释,因此解释它们的必要性也越来越大。本文提出了一个正式框架来支持对解释的系统评估,并提供了适用于不同结构的解释的示例,重点是自动事实验证任务。
- COLINGInfFeed: 以影响函数作为反馈来提高主观任务的性能
使用影响函数改进深度神经模型的性能并自动识别需要手动校正的数据点来提高模型性能,达到减少手动标注数据点数量的效果。
- 使用证据总结解释真实性预测:一种多任务模型方法
通过使用多任务可解释的神经模型进行自动化的事实检验,本研究讨论了社交媒体上快速传播的虚假信息,并探究了深层神经模型在预测时所关注的要素,以寻求与人类推理相媲美的推理水平。
- CrisisViT:一种适用于危机图像分类的稳健视觉 Transformer
利用最新的深度神经模型,通过将基于 Transformer 的架构应用于危机图像分类(CrisisViT),以解决利用社交媒体的公民新闻来帮助危机响应的问题,并通过实验证明,CrisisViT 模型在紧急类型、图像相关性、人道主义类别和损害 - 仇恨言论检测的生成式人工智能的评估和发现
使用深度神经模型自动检测仇恨言论受到标记数据稀缺性的影响,从而导致泛化能力差。为了缓解这个问题,利用生成式人工智能从现有标记示例中生成大量合成仇恨言论序列,并将生成的数据应用于微调大型预训练语言模型,如 BERT、RoBERTa 和 ALB - EDGE++:EDGE 训练和采样的改进
本文提出了对 EDGE 模型的改进,包括引入了一个特定度数的噪声计划,优化了每个时间步骤的活跃节点数量,显著减少了内存消耗,并提出了一个改进的采样方案,通过微调生成过程来更好地控制合成网络和真实网络之间的相似度,实验结果表明,这些改进不仅提 - SWAP: 時序上對第二高分數利用的對抗攻擊
时间序列分类是各个领域中的一个关键任务,深度神经模型在时间序列分类任务中展现出了卓越的性能。然而,这些模型容易受到对抗性攻击的影响,我们提出了一种名为 SWAP 的全新攻击方法,该方法能够提高次优预测的置信度,并通过最小化 Kullback - 深度学习中的校正:现有技术综述
深度神经模型校准在构建可靠的安全关键应用的人工智能系统中起着重要作用。本文回顾了最新的校准方法,并对它们进行了原理解析。
- 一种用于葡萄牙语肿瘤健康记录的生物医学实体提取流水线
采用深度神经模型,结合命名实体识别,并参考葡萄牙肿瘤研究所的专家意见,文中提出了一种从欧洲葡萄牙语癌症病历中提取手术程序,药物和疾病的策略,并取得了较好的性能表现。
- 基准测试忠实度:关于在视觉语言任务中实现准确的自然语言解释
本文探讨了目前逐渐普及应用的神经模型的透明度和可理解性的需求,提出了三种可信度测量方法,并在对不同模型架构的比较中使用 VQA-X 和 e-SNLI-VE 数据集进行了评估。
- EMNLP自然语言处理中主动学习的调查
本文介绍了活跃学习在自然语言处理中的应用,并对查询策略、结构化预测任务、注释成本、模型学习和活跃学习的起止等关键问题进行了探讨。结论部分对相关主题和未来方向进行了讨论。
- EMNLP走向摘要候选项融合
使用 SummaFusion 作为第二阶段抽象化摘要的方法,可以融合多个摘要候选人,达到更好的摘要效果。
- ACL临床文本的原型网络对诊断预测的可解释性
使用基于原型网络和标签注意力机制的 ProtoPatient 方法可准确预测临床文本中的诊断,并为医生提供可解释和有用的结果,定量和定性评估表明该模型优于现有基线模型,医学医生的进一步验证证明了该模型为临床决策支持提供了有价值的解释。
- 研究提议:“高质量数据是否足够?
本文研究如何选择和创建高质量基准数据的子集以及对于模型的有效学习是否真正需要大型数据集,并计划研究数据修剪和数据创建范式以生成高质量数据。
- 关系分类生成对抗样本的自动化方法
本文提出了一种从以实体为中心的视角生成相关对照数据的方法,通过在句法和语义依赖图中利用两个基本的拓扑性质,即中心性和最短路径来识别和干预实体的语境因果特征,从而使得深度神经模型更加稳健。
- ICLRAutoTriggER: 带辅助触发词提取的命名实体识别
本文提出了一个新的两阶段框架(AutoTriggER),通过自动生成和利用文本中的 “实体触发器” 来改善命名实体识别的性能,从而能够创建并利用辅助监督。在三个公认的命名实体识别数据集上的实验表明,我们自动提取的触发器与人工触发器非常匹配, - CVPRRSG: 一种用于学习不平衡数据集的简单而有效的模块
本文旨在解决机器学习中不平衡数据集对深度神经模型训练带来的困难,提出了一种新的稀有类样本生成器来增加训练数据,经过大量实验验证,其有效性得到了证实,并在多个数据集上取得了领先效果。
- 无监督深度关键词生成
本文提出了一种名为 AutoKeyGen 的关键词生成新方法,利用语料库中的短语库和部分匹配过程来确定文档中缺少的关键词,然后利用这些关键词训练一个深度生成模型,该方法在大量实验中表现优异,甚至能够在某些情况下击败强监督方法。
- EMNLP面向实体中心信息抽取的噪声标签学习
本文研究信息提取中遇到的嘈杂标签问题,提出了一个共同正则化框架来解决这个问题,该框架基于识别嘈杂标签需要更多训练步骤且更容易被忘记的性质,在 TACRED 和 CoNLL03 这两个嘈杂基准数据集上进行了广泛的实验,并发布了代码供未来研究使