科学话语标注以实现证据提取

ACLSep, 2019

Scientific Discourse Tagging for Evidence Extraction

Xiangci Li, Gully Burns, Nanyun Peng

TL;DR通过从全文中提取文本片段，利用以生物医学为域的语料预训练的深度表征学习探讨科学论述结构的分析和证据片段的提取，以提高科学主张的质量。

Abstract

Evidence plays a crucial role in any biomedical research narrative, providing justification for some claims and refutation for others. We seek to build models of scientific argument using →

biomedical research information extraction scientific argument evidence fragments deep representation learning

发现论文，激发创造

使用深度语篇模型和迁移学习提取生物医学出版物中的声明

本文介绍了一种用于从生物医学领域的科学文章摘要中提取科学主张的模型，该模型使用传递学习技术进行微调，并将其与基于规则和深度学习技术的几个基准模型进行比较。最终模型使用微调后的传递学习技术与基准模型相比，其 F1 得分提高了 14 个百分点。同时，作者还提供了一个公共工具用于进行论述和主张的预测以及注释工具，并探讨了其在生物医学文献以外的其他应用。

Jul, 2019

利用引文图谱进行科学信息提取

本文研究了如何利用引文图来提高科学信息提取的准确性，证明结合引文图与文本提取任务能提升科学信息提取的水平。

Jun, 2021

半监督神经标记的科学信息提取

本文通过将问题建模为序列标注，并利用半监督学习方法和数据选择方案，提出了一个基于神经标注模型的关键短语提取和分类算法，该算法在 2017 年 SemEval 科学信息抽取任务中明显优于现有信息抽取方法。

Aug, 2017

释放知识密集对话生成中的证据潜力

整合外部知识进入对话生成中的关键性为提高回应的正确性，在这里，证据片段作为有根据的支持性知识碎片。本文提出一种有效地整合证据到知识密集型对话生成中的框架，通过引入自动证据生成框架和证据聚焦的注意机制，扩大了证据的潜力。实验结果表明，提出的方法在模型性能方面优于其他基准（+3~+5 分），在连贯性和事实一致性方面有进一步的分析证实。

Sep, 2023

科学文章的基于序列的摘要提取

通过研究，本文在科学文章的有监督摘要提取方面展现了基于仅使用文档内文本的简单序列标记模型对简单分类模型的高效结果，并对句子级特征进行了最小化改进。通过进一步分析，我们展示了序列模型依赖文档结构且取决于学科领域的潜力。

Apr, 2022

从临床试验报告中推断哪些医疗治疗方法有效

本文介绍了一种新的任务和语料库，通过全文文章描述随机对照试验 (RCT) 的方式，推断与给定干预、比较和预期结果相关的报告发现，结果表明这项任务的困难性主要归因于长篇的技术性输入文本。

Apr, 2019

SciEv：科学新闻查找科学证据论文

SciEv 是一个系统，可以在给定科学新闻文章的情况下搜索科学证据论文，并采用两阶段查询范式以检索候选论文并进行重新排序，它使用领域知识实体来找到候选论文，证明比常规关键短语更有效，并在重排阶段中探索了新闻文章和候选论文的不同文档表示方法。

Apr, 2022

证据推断 2.0：更多数据，更好的模型

本文讨论如何利用 NLP 技术快速分析大量的疾病治疗相关的文章，以便于有效地整理出临床试验结果，并希望以此为基础构建出一个比较不同治疗方法的数据库，方便医生进行治疗决策。同时，本文还介绍了一个被称为 Evidence Inference 的公开数据集，该数据集包括了很多描述临床试验的文献，可以用于相关研究。

May, 2020

面向机器阅读理解的证据句子提取

本研究提出一种利用深度概率逻辑学习框架提取证据句子的方法，在三个具有挑战性的多项选择机器阅读理解数据集上实现了可比较或更好的性能，为多项选择机器阅读理解提供了新的思路。

Feb, 2019

利用话语结构创建会议摘要

基于 GNN 的节点分类模型，利用话语结构从复杂的多方讨论中筛选出最重要的话语，并生成提取式摘要，实验证明该方法超过现有的基于文本和图的提取式摘要系统。

May, 2024