基于GPT-3的信息提取,用于构建强大的知识库
该论文回顾和分类研究了在知识提取中的低资源情况中,利用高资源数据、更强模型、数据和模型相结合等三种方法进行的神经方法,并提出未来研究的方向和应用前景。
Feb, 2022
本研究比较了 GPT-3 和较小的预训练语言模型在少样本情况下在生物医学信息提取的性能,结果显示 GPT-3 的性能显著低于较小的预训练模型,同时对于信息提取任务可能会存在问题。因此作者建议在生物医学领域使用较小的预训练语言模型进行微调。
Mar, 2022
该研究针对GPT-3模型训练数据不足的问题,通过自动生成的样本增强小型训练集,在数据科学相关问题分类任务中比较了两种分类器的效果,证明了给予大型机器学习模型如GPT-3自己提出附加训练示例可以提高分类性能的结论。
May, 2022
SPIRES是一种基于大型语言模型的知识提取方法,使用零-shot学习和通用查询回答,以根据特定模式返回信息,支持知识管理和获取的手动曲调。
Apr, 2023
本文使用专业医学人士对GPT-3生成的医学文章摘要进行了评估,发现GPT-3虽然能够忠实地总结和简化单篇生物医学文章,但在多篇文章发现的证据综合方面存在困难。
May, 2023
本研究通过实验验证了GPT-3和GPT-4在8个BioNLP应用中的性能表现,并对其识别错误进行了分析,提出了在BioNLP应用中使用LLMs的建议。
May, 2023
该论文研究了如何使用基于自我监督学习的蒸馏模型,以大幅提高大型语言模型在生物医学知识整理和提取方面的效率和准确性。在药物不良事件提取等主要医学知识提取任务上,这种方法大大超越了标准模型,并具有成本效益和访问模型内部结构等优点。
Jul, 2023
在这项研究中,我们评估了两个最先进的语言模型——GPT-3和GPT-3.5(通常被称为ChatGPT)在提取叙述实体(事件、参与者和时间表达)方面的能力,并发现它们与开箱即用的基准系统相媲美,为资源有限的从业者提供了一种全能的替代方案。通过研究这些模型在信息提取领域的优势和局限性,我们提供了可以指导未来改进和探索的见解。
Nov, 2023
本研究针对信息提取(IE)领域中的现有方法与大语言模型(LLMs)之间的性能差距进行了深入分析。我们提出了一系列简单的基于提示的方法,以提升GPT-4在信息提取任务中的表现,实验结果验证了这些方法的有效性及其配套的问题,促进了大语言模型在NLP任务中的应用潜力。
Aug, 2024
本文研究了大型语言模型在信息提取任务中的应用,指出当前GPT-4在信息提取能力上与最先进的方法存在明显差距。提出了基于提示的简单方法以提高GPT-4的信息提取能力,并通过实验验证了这些方法的有效性及其存在的问题。
Aug, 2024