BriefGPT.xyz
Ask
alpha
关键词
spurious patterns
搜索结果 - 5
ICML
使用部分信息分解量化偏倚数据的虚假性
本文首次提出使用部分信息分解 (PID) 数学框架对数据集中的伪关联进行信息论的形式化定义,并通过计算独特信息来量化数据集的伪关联,研究了伪关联对模型的影响以及针对伪关联的数据处理技术的效果。
PDF
7 days ago
EMNLP
最大化利用少量反事实增强情感分类鲁棒性
针对文本分类任务中的模型过度依赖模式数据的问题,本文提出了一种新的解决方案,使用编码向量空间的自动生成机制减少新数据生成的人工成本,只需对原始训练数据的一小部分(例如 1%)进行注释即可获得明显的准确性改进。实验证明,该方法对情感分类有效,
→
PDF
2 years ago
通过解释发现和修复虚假模式
本文提出了一种端到端的流水线,用于识别和减轻图像分类器中的伪模式,通过数据增强的方法减轻了伪模式,在没有伪模式的环境下提高了模型的准确性和鲁棒性。
PDF
3 years ago
ICLR
利用反事实增强数据学习具有显著差异的因素
本文探讨了机器学习中由于混淆而导致的伪相关性问题,通过因果关系提供了明确的概念,并介绍了一种训练模型的方法和资源,可以降低其对伪相关性的敏感度,最终实验表明基于该方法提出的分类器在情感分析和自然语言推理任务上表现出了很好的性能。
PDF
5 years ago
EMNLP
神经对话问答:学习推理与利用模式
本研究旨在探讨神经会话 QA 任务中,ShARCQA 任务的最新研究进展,发现当前模型学习了数据集中的虚假线索和模式,创建了一个基于启发式的程序以利用这些模式,可以达到与神经模型相当的性能,通过创建并分享一个经过修改的数据集,减少虚假模式的
→
PDF
5 years ago
Prev
Next