使用现成论证挖掘预测亚马逊评论的有用性
这篇研究探讨了基于计算语言学的辩论挖掘的方法,通过适应实践数据中的辩论现象和创建一个新的标准语料库以及使用几种机器学习方法来识别辩论组件,证明了在用户生成的网络话语中进行辩论挖掘是可行的但具有挑战性的任务。
Jan, 2016
本文首次使用众包技术在中文酒店评论中采集论证注释,生成了包含4814个论证部件注释和411个论证关系注释的语料库,并且其注释质量与其他语言中广泛使用的论证语料库相当。
May, 2017
本研究探讨了如何在产品评论中识别有用的评论,并验证了基于论证的特征,如论证句子的百分比和依据结论的比率等,对于确定较佳评论的重要性。实验表明,与基准特征相结合使用时,基于论证的特征可使性能提高11.01%。
Jul, 2017
本文提出了一种新的句子注释方案,用于在任意网络文本上进行争议搜索的分析,得到的神经网络模型在准确度和F1分数上均优于传统的双向LSTM模型。
Feb, 2018
本文介绍了通过自动检测审稿人提出的论点和类型来研究同行评审过程的内容和结构,从而评估其效率和功效。作者首先收集了来自机器学习和自然语言处理领域的14.2K份审稿意见,并对其中的400份进行了注释,最终得出了一些结论并提出了未来新的挑战。
Mar, 2019
本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距,回顾、比较和分类现有方法、技术和工具,识别了结合任务和特征的积极成果,并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘方案,揭示了采用更灵活、可扩展框架的需求。
Jul, 2019
本文介绍了一个全面的、高精度的基于话语级查询的语料库广泛的Argument Mining系统,通过将适当索引的大型语料库上的句子级查询与迭代式注释方案结合起来,解决了数据中的固有标签偏差,标注手册所需的空间样本的区域,从而获得高精度的排名前几的候选项。
Nov, 2019
本文研究基于NLP和大量文本数据得到的自动化argument mining,评估argument质量估计对于不同领域的通用性、与相关argument mining任务的相互作用以及情感对于观察到的argument强度的影响。作者发现不同领域的训练数据可以提高质量估计的泛化能力,在零样本迁移和多任务实验中,argument quality在多个方面都能够得到改善,而情感对argument quality的影响不如人们普遍认为的那样大。
May, 2022
提出了一种混合(人 + AI)方法HyEnA,用于从具有倾向性的文本中提取论点,结合了自动处理速度和人类的理解和推理能力。在三个市民反馈文献中评估了HyEnA,发现它相对于多样的观点集合,既提供了更高的覆盖率和精确度,强调了人类洞察力的必要性,同时又减少了人力成本,与(完全手动的)专家分析相比并没有降低质量,从而展示了结合人工和人工智能的优势。
Mar, 2024
通过引入一个涵盖辩论中各项任务的论证挖掘数据集,我们评估了多种生成基准模型,并发现虽然它们在个别任务上表现出有希望的结果,但在全部任务上的整体性能明显下降,这对于我们提出的数据集提出了挑战,需要进一步研究端到端的论证挖掘和概括。
Jun, 2024