May, 2024

PGA-SciRE: 利用数据增强增强科学关系抽取的 LLM

TL;DR提出了一种名为 PGA 的基于文本数据增强的框架,利用语言模型(LLMs)通过改写原始训练集样本来增加伪样本的数量,以提高科学领域关系抽取模型的性能,并通过生成含有与标签相关信息的句子来指导 LLMs 生成更多的伪样本,实验证明 PGA 框架可以显著提升科学领域关系抽取模型的 F1 分数,并且使用 LLMs 获取样本还能有效降低手动标记数据的成本。