本文回顾了计算社会科学中利用文本分析解决因果推论中混淆变量引起偏差的方法,并提出数据处理及评估决策的指南。尽管在利用文本分析进行混淆因素调整方面已取得了进展,但仍存在很多未解决的问题。
May, 2020
文章提出了一种使用新的数据技术进行文本数据分析的概念框架,以发现可以测试社会科学理论的有用标准,并提供了一种基于隐含表征的文本数据推理方法。
Feb, 2018
该研究是一项针对自然语言处理中的因果关系研究,旨在提供因果推理与语言处理的交叉研究概述,并介绍了文本统计学方面的挑战和机遇,以及如何利用因果推理来提高 NLP 模型的健壮性,公平性和可解释性。
Sep, 2021
使用大量患者记录和治疗历史的文本数据,可以在临床数据的全部阶段中以最小的额外工作量支持因果推断,通过三种方式利用文本数据增强经典匹配分析,改善缺失数据的模拟值的准确性、增强匹配过程的合理性,并结合文本变量来估计易于解释的基于文本的治疗效应。希望利用这些技术拓展临床数据的次级分析范围,特别是在定量数据质量差或不存在的情况下,但有文本数据可用,例如在发展中国家。
Jun, 2023
该研究提供了第一个结合真实世界研究任务的文本因果推理方法的经验评估框架,评估了常用文本因果推理方法的优缺点,并公开任务、数据和模型,以促进应用和鼓励额外研究。
Sep, 2020
通过使用一些新的文本分类方法,我们研究了模型是否真正学习了组合句子的意义,或者仅仅关注一些关键词或词典。我们的结果表明,许多模型仍然只是关注词汇和关键词,因此我们提出了新的正则化技术来防止这种过拟合,并在实验中得到了良好的结果。
Jan, 2018
本文综述了早期人类构造的语言和句法规则以及最新机器学习技术在提取因果关系上的应用,并分析了它们的优劣,建议未来的研究方向。
May, 2016
通过绘制人类主体和有组织文本之间的平行关系,我们探讨了文本数据在进行因果推论时的作用。文章强调了关键因果概念和原则,并提出了两种策略来更好地确定因果查询问题。我们希望本文能提高人们对在使用文本数据进行因果推论时阐述和澄清基本概念的重要性的认识。
Feb, 2022
该研究旨在使用自然语言特征提取方法在机器学习中,将朴素贝叶斯、逻辑回归和支持向量机等基本模型用于检测讨论线路偏离主题时教师必须介入的情况,从而实现文本分类和语义分析。
Nov, 2022
本篇论文探讨了使用句子语境与事件信息以及利用掩码事件语境和领域内外数据分布来识别自然语言文本中事件之间的因果关系,并证明该方法在三个不同的数据集上均取得了最新技术的表现,可用于从非结构化文本中提取因果关系图或建立事件链。
Dec, 2020