医学领域跨语言论证挖掘

Jan, 2023

Cross-lingual Argument Mining in the Medical Domain

Anar Yeginbergenova, Rodrigo Agerri

TL;DR通过将英文数据翻译并投影到目标语言（西班牙语）的方法，我们有效地生成了无需手动干预的带注释数据，并证明了其优于使用大型屏蔽多语言语言模型的零 - shot 跨语言方法。同时，我们还展示了西班牙语中自动生成的数据如何用于改善英语评估设置中的结果。

Abstract

Nowadays the medical domain is receiving more and more attention in applications involving artificial intelligence. Clinicians have to deal with an enormous amount of unstructured textual data to make a conclusio

artificial intelligence medical domain argument mining language processing annotated data

发现论文，激发创造

跨语言论证挖掘：机器翻译 (和一点投影) 是你所需的一切！

该研究创建了适用于跨语种论证挖掘的平行语料库，并比较了注释映射和基于双语词嵌入的直接转移策略，发现前者表现更好且几乎消除了跨语种传递的损失。

Jul, 2018

多语言论点挖掘：数据集和分析

本研究探索了利用多语言 BERT 模型进行传输学习，以识别非英语语言中的论证挖掘任务。结果表明，机器翻译的质量对于论点立场和证据检测任务而言很好，但对于论证质量评估任务来说则不太适合。研究还展示了语言选择和它们之间的关系对结果模型的准确性产生了影响，并提供了一个多语言的人工数据集，以方便进行传输学习的效果评估。

Oct, 2020

RuArg-2022: 论点挖掘评估

本文是 Dialogue 会议对针对新冠疫情（疫苗、隔离和戴口罩）话题的社交媒体评论进行第一次俄语言论分析系统及其竞赛的组织者报告，由 NLI 变体的 BERT 体系结构获胜，希望为俄文文本的论证挖掘研究提供帮助。

Jun, 2022

用户生成网络话语中的论证挖掘

这篇研究探讨了基于计算语言学的辩论挖掘的方法，通过适应实践数据中的辩论现象和创建一个新的标准语料库以及使用几种机器学习方法来识别辩论组件，证明了在用户生成的网络话语中进行辩论挖掘是可行的但具有挑战性的任务。

Jan, 2016

基于 Transformer 的自动辨识论述关系模型：跨领域评估

该研究使用了 US2016 辩论语料库来训练基于 Transformer 模型的种类，以推测不同参数下论据的关系，最终在五个不同领域中评价模型的性能，得出了极高的 F1 得分，并确定了相对不依赖特定领域的模型。

Nov, 2020

论证挖掘的演进：从模型到社交媒体和新型工具

本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距，回顾、比较和分类现有方法、技术和工具，识别了结合任务和特征的积极成果，并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘方案，揭示了采用更灵活、可扩展框架的需求。

Jul, 2019

法院判决中的法律论点挖掘

该研究探讨了法律文本中的论点自动提取与语义分析方法，采用基于欧洲人权法院纪录的一种新的注释方案，提出了一种改进的模型，能够更加准确地对法律审判过程中的论点进行自动化提取与分类。

Aug, 2022

使用基于注意力机制的神经网络从异构数据源中进行跨主题争论挖掘

本文提出了一种新的句子注释方案，用于在任意网络文本上进行争议搜索的分析，得到的神经网络模型在准确度和 F1 分数上均优于传统的双向 LSTM 模型。

Feb, 2018

住院医学考试中正确答案的解释性论证提取

为了协助医学专家在日常活动中开发所需技术成为目前人工智能研究领域的热门话题。因此，最近提出了许多大型语言模型（LLMs）和自动基准，旨在利用自然语言作为人工智能与人类交互的工具，促进循证医学中的信息提取。本文提出了一个新的数据集，通过与以往研究不同的方式：（i）不仅包括正确答案的解释性论证，还包括解释错误答案不正确的论证；（ii）解释是由医生撰写的，以回答西班牙住院医师考试的问题。我们还利用这个新的基准来设置一项新的提取任务，即识别医生撰写的正确答案的解释。我们的设置的另一个好处是，我们可以利用提取问答范式来自动评估 LLMs 的性能，而不需要昂贵的人工评估。对西班牙语的语言模型进行了全面的实验，结果显示有时多语言模型的性能优于单语模型，甚至超过了已经针对医学领域进行调整的模型。此外，单语模型的结果不一致，表现竞争力的模型实际上更小、更低级。无论怎样，所获得的结果表明我们的新数据集和方法可以有效帮助医学专业人员识别与医学问题相关的循证解释。

Dec, 2023

利用领域预训练和神经网络增强法律论证挖掘

本文对传统词嵌入模型与 BERT 模型在人权法庭裁决文本的法条分析任务中的表现进行了比较，实验证明领域特定的 BERT 模型有很大的潜力，而传统的词嵌入模型在与神经网络层结合后也能表现出很强的性能。

Feb, 2022