科学话语标注以实现证据提取
本文介绍了一种用于从生物医学领域的科学文章摘要中提取科学主张的模型,该模型使用传递学习技术进行微调,并将其与基于规则和深度学习技术的几个基准模型进行比较。最终模型使用微调后的传递学习技术与基准模型相比,其 F1 得分提高了 14 个百分点。同时,作者还提供了一个公共工具用于进行论述和主张的预测以及注释工具,并探讨了其在生物医学文献以外的其他应用。
Jul, 2019
本文通过将问题建模为序列标注,并利用半监督学习方法和数据选择方案,提出了一个基于神经标注模型的关键短语提取和分类算法,该算法在 2017 年 SemEval 科学信息抽取任务中明显优于现有信息抽取方法。
Aug, 2017
整合外部知识进入对话生成中的关键性为提高回应的正确性,在这里,证据片段作为有根据的支持性知识碎片。本文提出一种有效地整合证据到知识密集型对话生成中的框架,通过引入自动证据生成框架和证据聚焦的注意机制,扩大了证据的潜力。实验结果表明,提出的方法在模型性能方面优于其他基准(+3~+5 分),在连贯性和事实一致性方面有进一步的分析证实。
Sep, 2023
通过研究,本文在科学文章的有监督摘要提取方面展现了基于仅使用文档内文本的简单序列标记模型对简单分类模型的高效结果,并对句子级特征进行了最小化改进。通过进一步分析,我们展示了序列模型依赖文档结构且取决于学科领域的潜力。
Apr, 2022
本文介绍了一种新的任务和语料库,通过全文文章描述随机对照试验 (RCT) 的方式,推断与给定干预、比较和预期结果相关的报告发现,结果表明这项任务的困难性主要归因于长篇的技术性输入文本。
Apr, 2019
SciEv 是一个系统,可以在给定科学新闻文章的情况下搜索科学证据论文,并采用两阶段查询范式以检索候选论文并进行重新排序,它使用领域知识实体来找到候选论文,证明比常规关键短语更有效,并在重排阶段中探索了新闻文章和候选论文的不同文档表示方法。
Apr, 2022
本文讨论如何利用 NLP 技术快速分析大量的疾病治疗相关的文章,以便于有效地整理出临床试验结果,并希望以此为基础构建出一个比较不同治疗方法的数据库,方便医生进行治疗决策。同时,本文还介绍了一个被称为 Evidence Inference 的公开数据集,该数据集包括了很多描述临床试验的文献,可以用于相关研究。
May, 2020
本研究提出一种利用深度概率逻辑学习框架提取证据句子的方法,在三个具有挑战性的多项选择机器阅读理解数据集上实现了可比较或更好的性能,为多项选择机器阅读理解提供了新的思路。
Feb, 2019