基于GPT-3的信息提取，用于构建强大的知识库

Jul, 2024

基于GPT-3的信息提取，用于构建强大的知识库

GPT-3 Powered Information Extraction for Building Robust Knowledge Bases

Ritabrata Roy Choudhury, Soumik Dey

TL;DR本研究解决了从非结构化文本中提取结构化信息的难题，提出了一种基于先进语言模型GPT-3的新方法。实验表明，该方法在提取相关实体和关系时具有高效性和准确性，有望显著提高知识库构建的精度和生产力。

Abstract

This work uses the state-of-the-art language model GPT-3 to offer a novel method of Information Extraction for knowledge base development. The suggested method attempts to solve the difficulties associated with o

发现论文，激发创造

低资源场景下的知识提取：调研与视角

该论文回顾和分类研究了在知识提取中的低资源情况中，利用高资源数据、更强模型、数据和模型相结合等三种方法进行的神经方法，并提出未来研究的方向和应用前景。

Feb, 2022

反思GPT-3在生物医学信息提取中的上下文学习

本研究比较了 GPT-3 和较小的预训练语言模型在少样本情况下在生物医学信息提取的性能，结果显示 GPT-3 的性能显著低于较小的预训练模型，同时对于信息提取任务可能会存在问题。因此作者建议在生物医学领域使用较小的预训练语言模型进行微调。

Mar, 2022

利用GPT-3扩充数据，提高短文本分类的性能

该研究针对GPT-3模型训练数据不足的问题，通过自动生成的样本增强小型训练集，在数据科学相关问题分类任务中比较了两种分类器的效果，证明了给予大型机器学习模型如GPT-3自己提出附加训练示例可以提高分类性能的结论。

May, 2022

用结构化提示问询和递归语义抽取（SPIRES）：一种使用零样本学习填充知识库的方法

SPIRES是一种基于大型语言模型的知识提取方法，使用零-shot学习和通用查询回答，以根据特定模式返回信息，支持知识管理和获取的手动曲调。

Apr, 2023

使用GPT-3对医学证据进行总结、简化和综合（成功率不同）

本文使用专业医学人士对GPT-3生成的医学文章摘要进行了评估，发现GPT-3虽然能够忠实地总结和简化单篇生物医学文章，但在多篇文章发现的证据综合方面存在困难。

May, 2023

生物医学自然语言处理中的大型语言模型：基准、基线和建议

本研究通过实验验证了GPT-3和GPT-4在8个BioNLP应用中的性能表现，并对其识别错误进行了分析，提出了在BioNLP应用中使用LLMs的建议。

May, 2023

使用大型语言模型进行生物医学知识提取的精馏：以药物不良反应为例的案例研究

该论文研究了如何使用基于自我监督学习的蒸馏模型，以大幅提高大型语言模型在生物医学知识整理和提取方面的效率和准确性。在药物不良事件提取等主要医学知识提取任务上，这种方法大大超越了标准模型，并具有成本效益和访问模型内部结构等优点。

Jul, 2023

GPT模型对叙事实体提取的探究

在这项研究中，我们评估了两个最先进的语言模型——GPT-3和GPT-3.5（通常被称为ChatGPT）在提取叙述实体（事件、参与者和时间表达）方面的能力，并发现它们与开箱即用的基准系统相媲美，为资源有限的从业者提供了一种全能的替代方案。通过研究这些模型在信息提取领域的优势和局限性，我们提供了可以指导未来改进和探索的见解。

Nov, 2023

基于大语言模型的信息提取实证研究

本研究针对信息提取（IE）领域中的现有方法与大语言模型（LLMs）之间的性能差距进行了深入分析。我们提出了一系列简单的基于提示的方法，以提升GPT-4在信息提取任务中的表现，实验结果验证了这些方法的有效性及其配套的问题，促进了大语言模型在NLP任务中的应用潜力。

Aug, 2024

基于大型语言模型的信息提取实证研究

本文研究了大型语言模型在信息提取任务中的应用，指出当前GPT-4在信息提取能力上与最先进的方法存在明显差距。提出了基于提示的简单方法以提高GPT-4的信息提取能力，并通过实验验证了这些方法的有效性及其存在的问题。

Aug, 2024