越南开放信息提取
该论文使用众包方法评估两种最先进的开放信息抽取系统在 10 个不同学科的科学文本上的性能,发现 OIE 系统在科学文本上的表现明显劣于百科全书文本,在提供错误分析并建议减少错误的领域的同时,提出了一个句子和判断的语料库。
Feb, 2018
本文释放、描述和分析了一个名为 OPIEC 的 OIE 语料库,其中包含超过 340M 个三元组,是目前公开可用的最大的 OIE 语料库。我们发现,在 OPIEC 中存在的大多数实体之间的事实在 DBpedia 和 / 或 YAGO 中找不到。此外,OIE open relations 通常高度多义性。我们相信 OPIEC 语料库是未来自动知识库构建研究的有价值的资源。
Apr, 2019
自然语言处理中的开放信息提取(OIE)通过引入预训练语言模型和语言特征,通过 Seq2Seq 预训练语言模型提升 OIE 架构性能,并在性能评估中获得了 24.9%、27.3% 和 14.9% 的改进。此外,还介绍了其他挑战,如利用语义依赖解析标签减少计算开销、创建干净的合成数据集以及探究 OIE 行为在结构化预测模型中的表现。
Mar, 2024
本研究提出了一种创新的 APRCOIE 模型,专门用于处理中文文本,通过自动生成抽取模式,可以处理各种复杂多样的中文语法现象,与现有的中文 OIE 模型相比,APRCOIE 表现更好并显著扩展了 OIE 性能的界限。
Mar, 2024
通过构建合适的推理环境,本文探索利用大型语言模型(LLMs)解决开放式信息抽取(OIE)问题,实验结果表明,相较于最先进的监督方法,我们的 6-shot 方法在标准 CaRB 基准上实现了 55.3 的 F1 分数,同时在 TACRED 和 ACE05 上实验结果显示,我们的方法可以自然地推广到其他信息抽取任务,并分别获得了 5.7 和 6.8 的 F1 分数提升。
Oct, 2023
本文系统综述了 2007 年至 2022 年间的开放信息提取技术,提出了基于信息来源的新分类方法,并总结了三种主要方法、当前流行的数据集和模型评估指标,展示了数据集、信息来源、输出形式、方法和评估指标等方面的未来发展方向。
Aug, 2022
这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述,其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点,以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后,我们列出了能够扩展其范围和适用性的最新趋势,为 OpenIE 领域的未来研究开辟了有前途的方向。
May, 2022
本研究针对科技文本的开放式关系抽取技术不足问题,将窄 IE 系统和开放式 IE 系统结合,提出了一种新的任务 —— 半开放式关系抽取,并应用于生物领域。研究在 FOBIE 数据集上,训练出能够提取生物学文本中重要关系和论述的最先进的窄 IE 系统,并在 10k 篇生物学开放式科技文本上运行窄 IE 系统和开放式 IE 系统,取得了过滤出 65% 的错误和无用开放式 IE 提取结果,并且发现保留下来的提取结果对于读者更有信息价值。
May, 2020