- 系统评估推理捷径的基准套件
强大的神经分类器的出现增加了对既需要学习又需要推理的问题的兴趣,该研究论文介绍了一个包含任务评估、概念质量评估和推理快捷方式验证的综合基准套件,旨在系统地评估推理快捷方式对模型的影响。
- 在对抗性攻击下实现不确定性校准的认证
神经分类器对扰动敏感,证书方法提供对其预测的扰动不敏感性的可证明保证,而模型的置信度在安全关键应用中尤为重要。我们证明了攻击可以严重影响置信度,并提出了对置信度的最坏情况下的证书校准作为对抗性扰动下的置信度的界限。最后,我们提出了新的校准攻 - 更好地了解自己:多样的判别特征学习改善开放式识别
我们通过对开放集识别方法进行分析,重点关注特征多样性方面,揭示了学习多样化辨别特征与提升开放集识别性能之间的显著相关性,并基于此洞见提出了一种利用特征多样性优势的新型开放集识别方法,通过在标准的开放集识别测试平台上进行严格评估,证明我们的方 - 通过集合成员方法发现特征关联性并解释神经分类器的决策
介绍了一种新的方法来发现由训练后的神经分类器认为具有重要意义的特征,以及这些特征如何影响分类器的输出,从而获得其决策的解释。该方法基于可靠的数学方法,提供了分类器决策前提的可靠估计,重申特征相关性的重要性。
- AAAI生物句间关系抽取的神经结构
本文介绍了一种基于深度学习的跨句子关系抽取模型,以生物医学领域中的生化事件为例,探讨如何自动给生化事件赋予其所处的生物体系背景,并提出了两种不同的神经网络模型分类器,结果表明,该模型精度比传统机器学习模型更高,特别是在跨句子关系抽取方面的难 - ICML破坏 3D 虚拟环境:可转移的对抗性 3D 对象
本研究研究了如何通过改变材质,使用易于访问的元素构建具有敌对性的 3D 物体,以此欺骗神经分类器,以评估其在流行神经分类器中的影响。
- EMNLPHypoGen:利用常识与反事实知识进行夸张生成
本文旨在研究句子级夸张生成的计算探索,通过系统研究程度强化的代表性句法模式以及其中每个成分间的语义关系,借助 COMeT 和 reverse COMeT 模型进行共识和反事实推理并生成多个夸张候选,通过训练神经分类器来排名和选择高质量的夸张 - SelfExplain: 一种用于神经文本分类器的自说明体系结构
SelfExplain 是一种新型的自解释模型,通过基于短语的概念解释文本分类器的预测,在不降低性能的同时增加可解释性,实验结果表明 SelfExplain 的解释能力足以促进模型的置信度。
- 基于能量的区分度检测
在开放世界中安全部署机器学习模型的重要基础是确定输入是否为 ODD, 然而,传统基于 softmax 置信度得分的方法在 ODD 数据的后验分布上存在过度自信的问题,本文提出了一个使用能量分数的 ODD 检测的统一框架,理论上更能够识别 “ - 黑盒分类器的主动贝叶斯评估
本文提出了一种主动贝叶斯方法,通过选择实例进行标记来提高分类器模型性能的评估,从而在可靠性和标签效率上都满足要求,通过一系列系统实验评估现代神经分类器(例如,ResNet 和 BERT)在几个标准图像和文本分类数据集上的性能,证明了该方法的 - ACL通过投影实现对拼写错误鲁棒的设备端文本表达
这篇论文展示了一种基于投影的神经分类器对于输入文本的错拼和扰动具有内在的鲁棒性,并且比使用 BiLSTMs 和精调 BERT 的方法更加稳健。
- ACL欧盟立法上的大规模多标签文本分类
该研究在法律领域考虑了大规模多标签文本分类,提出了一个适用于 LMTC、few - 和 zero-shot 学习的新数据集 EURLEX,共包含 57k 个法律文档,注释有~4.3k 个 EUROVOC 标签;实验表明,具有标签注意力的 B - ICLR自信度分类器用于异常检测的分析
本文针对图像分类中的 ODD 问题,分析研究了最近提出的使用置信分类器来检测 ODD 样本的方法,并结论表明该方法仍会对偏离训练数据分布的 OOD 样本产生高置信度,建议新增 “拒绝” 类别来训练分类器。
- 信息检索对话中的用户意图预测
研究了信息检索中用户意图识别的两个方面,提取基于内容,结构和情感特征的特征,利用经典机器学习方法执行用户意图预测,使用特征重要性分析确定了结构特征对预测的贡献最大,并构建了神经分类器以提高性能。
- 文本数据种的人口属性对抗性剔除
本篇论文通过实验证明,作者的人口统计信息可以从神经分类器中间表示中被检测出来;在尝试用对抗性训练去除这些信息时,该方法效果不佳,需要注意敏感特征的不变表示不应仅依赖于对抗性训练。