使用文本分类器进行因果推断的挑战

EMNLPOct, 2018

使用文本分类器进行因果推断的挑战

Challenges of Using Text Classifiers for Causal Inference

Zach Wood-Doughty, Ilya Shpitser, Mark Dredze

TL;DR本研究探讨了文本分类器在因果推断中的应用，研究结果表明其可用于基于语言数据的因果分析，并讨论了使用文本数据进行因果推断的机会和挑战。

Abstract

causal understanding is essential for many kinds of decision-making, but causal inference from observational data has typically only been

causal understanding observational data text classifiers causal inference language data

发现论文，激发创造

文本与因果推断：使用文本消除因果估计中的混淆因素的综述

本文回顾了计算社会科学中利用文本分析解决因果推论中混淆变量引起偏差的方法，并提出数据处理及评估决策的指南。尽管在利用文本分析进行混淆因素调整方面已取得了进展，但仍存在很多未解决的问题。

May, 2020

利用文本进行因果推断的方法

文章提出了一种使用新的数据技术进行文本数据分析的概念框架，以发现可以测试社会科学理论的有用标准，并提供了一种基于隐含表征的文本数据推理方法。

Feb, 2018

自然语言处理中的因果推断：估计、预测、解释及其它

该研究是一项针对自然语言处理中的因果关系研究，旨在提供因果推理与语言处理的交叉研究概述，并介绍了文本统计学方面的挑战和机遇，以及如何利用因果推理来提高 NLP 模型的健壮性，公平性和可解释性。

Sep, 2021

利用电子健康记录进行因果推断的文本数据挖掘

使用大量患者记录和治疗历史的文本数据，可以在临床数据的全部阶段中以最小的额外工作量支持因果推断，通过三种方式利用文本数据增强经典匹配分析，改善缺失数据的模拟值的准确性、增强匹配过程的合理性，并结合文本变量来估计易于解释的基于文本的治疗效应。希望利用这些技术拓展临床数据的次级分析范围，特别是在定量数据质量差或不存在的情况下，但有文本数据可用，例如在发展中国家。

Jun, 2023

使用文本进行混淆因素调整：因果推断中的挑战和实证评估框架

该研究提供了第一个结合真实世界研究任务的文本因果推理方法的经验评估框架，评估了常用文本因果推理方法的优缺点，并公开任务、数据和模型，以促进应用和鼓励额外研究。

Sep, 2020

探究文本分类器的工作

通过使用一些新的文本分类方法，我们研究了模型是否真正学习了组合句子的意义，或者仅仅关注一些关键词或词典。我们的结果表明，许多模型仍然只是关注词汇和关键词，因此我们提出了新的正则化技术来防止这种过拟合，并在实验中得到了良好的结果。

Jan, 2018

从自然语言文本中自动提取因果关系：综述

本文综述了早期人类构造的语言和句法规则以及最新机器学习技术在提取因果关系上的应用，并分析了它们的优劣，建议未来的研究方向。

May, 2016

使用文本数据进行因果推断的几点思考：人类受试者和组织化文本之间的相似之处

通过绘制人类主体和有组织文本之间的平行关系，我们探讨了文本数据在进行因果推论时的作用。文章强调了关键因果概念和原则，并提出了两种策略来更好地确定因果查询问题。我们希望本文能提高人们对在使用文本数据进行因果推论时阐述和澄清基本概念的重要性的认识。

Feb, 2022

使用机器学习模型对文本进行分类并确定对话偏移

该研究旨在使用自然语言特征提取方法在机器学习中，将朴素贝叶斯、逻辑回归和支持向量机等基本模型用于检测讨论线路偏离主题时教师必须介入的情况，从而实现文本分类和语义分析。

Nov, 2022

Causal BERT: 文本中事件因果检测的语言模型

本篇论文探讨了使用句子语境与事件信息以及利用掩码事件语境和领域内外数据分布来识别自然语言文本中事件之间的因果关系，并证明该方法在三个不同的数据集上均取得了最新技术的表现，可用于从非结构化文本中提取因果关系图或建立事件链。

Dec, 2020