- AAAI一种自回归的文本到图形框架用于联合实体和关系抽取
我们提出了一种新的方法,将无结构文本中的实体和关系提取作为条件序列生成问题,采用基于跨度的方法生成线性化图,其中节点表示文本跨度,边表示关系三元组。通过跨度表示,我们的模型可以捕捉实体和关系的结构特征和边界,并通过指向机制将生成的输出与原始 - AAAI多视角解耦学习改进低资源基于提示的关系表示
在低资源情境下,通过多视角关系表示的基于提示的方法(MVRE)能够有效提高关系抽取任务的性能,并在三个基准数据集上达到了最先进的低资源表现。
- 实体或关系嵌入:关系抽取编码策略分析
关系抽取问题可以通过微调预训练语言模型来解决,本文通过附加一个 [MASK] token 的提示来改善关系抽取模型,并结合头尾实体的嵌入表示,最终得到一个简单的模型,表现优于现有方法。
- EMNLPChatGPT 对马来西亚英语的理解能力:命名实体识别和关系抽取的评估
本研究通过在马来西亚英语新闻(MEN)数据集上评估 ChatGPT 的能力,提出了一种名为 “教育 - 预测 - 评估” 的三步方法,并发现 ChatGPT 在从马来西亚英语新闻文章中提取实体方面表现不佳,但在关系抽取方面的表现却不受形态句 - SegMix:一种简单的结构感知数据增强方法
提出了一种基于插值的数据增强算法 SegMix,该算法在具有任务特定结构的有意义的片段上进行插值,相比之前的方法在命名实体识别(NER)和关系抽取(RE)任务中表现更好,尤其在数据稀缺的情况下性能提升明显。
- CARE:从临床文献中提取实验结果
从文献中提取细粒度实验结果可以为科学应用提供巨大效益,而本研究聚焦于生物医学领域,提出了一种新的信息抽取数据集 CARE (临床聚合导向结果抽取),以提取临床发现结果。在该数据集上对多种最先进的信息抽取系统进行了性能评估,结果表明本数据集的 - 在未开发的生物医学领域中的关系抽取:多样性优化采样和合成数据生成方法
稀缺的标记数据对于关系抽取模型的发展和各种生物医学领域数据库的完成构成了障碍。本研究针对自然产物文献,探索了关系抽取模型在药物发现中的应用,并通过开放大型语言模型进行了几种方案的评估,显示精细调整合成摘要数据比原始噪声数据获得了显著改善。
- AAAI新闻文章中的关系抽取(RENA):流行病监测工具
从新闻文章中提取关键实体和语义关系的关系抽取工具(RENA)是一个基于浏览器的工具,可以用于处理与传染性疾病相关的英语新闻文章。该系统使用 React 框架构建,向用户展示了简洁和用户友好的界面。它允许用户输入一篇新闻文章,并从两个模型中选 - 基于向量化词汇 - 句法模式的金融文件关系抽取的最近邻搜索
通过密集向量的近邻搜索,我们介绍了一种简单的方法,在测试时间通过训练关系来解决隐含表达和长尾关系类的问题,此方法在 REFinD 上实现了最先进的性能。
- 基于预训练语言模型的上下文小样本关系抽取
通过预训练的语言模型,我们提出了一种新颖的在上下文中进行少样本关系抽取的框架,该框架可以消除命名实体识别和人工注释文档的需要,并实现了与现有方法相比最先进的性能。
- 基于提示性数据编程的弱监督文档级关系抽取
通过结合基于提示的技术和数据编程,PromptRE 是一种新型的弱监督文档级关系提取方法,利用标签分布和实体类型作为先验知识来改善性能,在关系分类和处理 “无关系” 问题方面表现出了更好的性能,实验证明 PromptRE 在 ReDocRE - EMNLP人工敌对样本与友好样本对 BERT 泛化能力的影响
通过实验验证,针对固定大小的训练样本,10-30% 含有人工对抗元素的训练样本可以提高文本分类和关系抽取等任务的准确性和 F1 分数,超出这一范围的增加可能导致性能停滞甚至降低。与此相反,带有人类友好元素的训练样本可能不利于模型的泛化能力, - EMNLP再探大型语言模型作为零 - shot 关系抽取器
本研究聚焦于使用大型语言模型作为无样本关系抽取器。通过分析现有关系抽取提示的不足之处,并引入诸如 CoT 的最新提示技术,我们提出了一种名为 SumAsk 的简单提示方法,通过使用大型语言模型将关系抽取输入转化为有效的问答格式。同时,我们在 - 基于深度学习模型的上下文关系抽取的比较分析
使用深度学习技术来从多个句子的语境中识别适当的语义关系,以解决现有机器学习模型难以从复杂句子中提取关系的问题。本文探讨了用于关系提取的各种深度学习模型的分析。
- ReOnto: 一种用于生物医学关系提取的神经符号方法
ReOnto 是一种利用神经符号知识进行关系抽取任务的新技术,通过使用图神经网络获取句子表示并利用公开可访问的本体论来确定两个实体之间的句内关系,从本体论中提取两个实体之间的关系路径。在两个公共生物医学数据集 BioRel 和 ADE 上进 - 大型语言模型对指令的稳健性评估
指令微调方法能够增强大型语言模型在未知任务上的零样本功能,并对其性能和稳健性进行了评估,发现在处理陌生指令时性能显著下降,而对于关系抽取指令的稳健性较问答指令更差。
- CARE:用于联合实体和关系抽取的共同注意力网络
我们提出了一种名为 CARE 的 Co-Attention 网络模型,可以实现联合实体和关系的抽取任务,通过学习各个子任务的独立表示以避免特征重叠,并通过双向交互来提升模型性能,实验结果表明我们的模型在三个基准数据集上表现优秀。
- 基于图递归神经网络和动态反馈森林算法的关系三元组提取
从文本中提取关系三元组(主语、谓语、宾语)可以将非结构化文本数据转换为结构化知识。本文提出了一种将三元组提取任务转换为图标签问题的新方法,利用依存解析和图递归神经网络(GRNNs)的结构信息。为了集成子任务,本文提出了一种动态反馈森林算法, - 通过从集合扩充中提取示例,通过语言探测推进关系抽取
关系抽取(RE)是一项在从非结构化文本中自动提取结构化信息的关键任务。本文提出了一种综合多方面方法,通过代表性示例和共集扩展来增强关系分类的准确性,并减轻对比类之间的混淆。通过与现有的微调方法相比,实证评估表明,该共集扩展方法使关系分类性能 - LASIGE 和 UNICAGE 对 NASA LitCoin NLP 竞赛的解决方案
本研究介绍了将工业数据工程解决方案与生物医学命名实体识别和关系抽取系统相结合,通过引入来自其他数据集和生物医学本体知识的附加训练数据,以解决生物医学自然语言处理中的文本处理问题。我们在 2022 年 LitCoin NLP 挑战中使用了这一