用户生成网络话语中的论证挖掘
本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距,回顾、比较和分类现有方法、技术和工具,识别了结合任务和特征的积极成果,并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘方案,揭示了采用更灵活、可扩展框架的需求。
Jul, 2019
本文提出了一种计算模型,该模型结合了微观层面和宏观层面的论证模型,基于 Rhetorical Structure Theory 利用上下文信息来预测关系,使用候选选择方法自动预测讨论中被其他参与者针对的论点,其结果优于最新的 state-of-the-art 方法。
Apr, 2020
该研究探讨了法律文本中的论点自动提取与语义分析方法,采用基于欧洲人权法院纪录的一种新的注释方案,提出了一种改进的模型,能够更加准确地对法律审判过程中的论点进行自动化提取与分类。
Aug, 2022
本文是 Dialogue 会议对针对新冠疫情(疫苗、隔离和戴口罩)话题的社交媒体评论进行第一次俄语言论分析系统及其竞赛的组织者报告,由 NLI 变体的 BERT 体系结构获胜,希望为俄文文本的论证挖掘研究提供帮助。
Jun, 2022
通过将英文数据翻译并投影到目标语言(西班牙语)的方法,我们有效地生成了无需手动干预的带注释数据,并证明了其优于使用大型屏蔽多语言语言模型的零 - shot 跨语言方法。同时,我们还展示了西班牙语中自动生成的数据如何用于改善英语评估设置中的结果。
Jan, 2023
本文介绍了一个全面的、高精度的基于话语级查询的语料库广泛的 Argument Mining 系统,通过将适当索引的大型语料库上的句子级查询与迭代式注释方案结合起来,解决了数据中的固有标签偏差,标注手册所需的空间样本的区域,从而获得高精度的排名前几的候选项。
Nov, 2019
该研究使用多任务学习方法将不同的论证挖掘任务相结合,利用语义和逻辑结构的相似性来提高性能,从而揭示了论证挖掘任务之间的共性,为文本中论证技巧的提取提供了整体方法。
Jul, 2023
本研究提出了一种基于社交讨论的无监督学习策略,使用已预训练的语言模型,选择性地使用掩码语言模型任务进行微调,并引入了一种基于提示的策略,在将被提取的论点组件之间预测关系时支持上下文语境,此方法表现出了在本领域和跨领域数据集上超越了多个现有的和强基线模型的潜力。
Mar, 2022
本文介绍了通过自动检测审稿人提出的论点和类型来研究同行评审过程的内容和结构,从而评估其效率和功效。作者首先收集了来自机器学习和自然语言处理领域的 14.2K 份审稿意见,并对其中的 400 份进行了注释,最终得出了一些结论并提出了未来新的挑战。
Mar, 2019
本文提出了一种新的句子注释方案,用于在任意网络文本上进行争议搜索的分析,得到的神经网络模型在准确度和 F1 分数上均优于传统的双向 LSTM 模型。
Feb, 2018