May, 2024
PGA-SciRE: 利用数据增强增强科学关系抽取的 LLM
PGA-SciRE: Harnessing LLM on Data Augmentation for Enhancing Scientific Relation Extraction
Yang Zhou, Shimin Shan, Hongkui Wei, Zhehuan Zhao, Wenshuo Feng
TL;DR提出了一种名为 PGA 的基于文本数据增强的框架,利用语言模型(LLMs)通过改写原始训练集样本来增加伪样本的数量,以提高科学领域关系抽取模型的性能,并通过生成含有与标签相关信息的句子来指导 LLMs 生成更多的伪样本,实验证明 PGA 框架可以显著提升科学领域关系抽取模型的 F1 分数,并且使用 LLMs 获取样本还能有效降低手动标记数据的成本。