Feb, 2024

EventRL: 利用结果监督增强大型语言模型的事件提取

TL;DR本研究提出了 EventRL,一种强化学习方法,用于改进大型语言模型(LLMs)的事件提取。通过特定的奖励函数和结果监督,EventRL 有效解决了 LLMs 中的指令遵循和虚构等问题,改进了事件识别和结构化的性能,特别是在处理新事件类型方面。研究强调了奖励函数选择的关键作用,并展示了在事件提取中引入代码数据的益处。增加模型大小可以提高准确性,但保持泛化能力至关重要以避免过拟合。