Nov, 2023
基于 LLM 伪标签的半监督学习提升抽取式摘要生成
Enchancing Semi-Supervised Learning for Extractive Summarization with an LLM-based pseudolabeler
Gaurav Sahu, Olga Vechtomova, Issam H. Laradji
TL;DR使用半监督方法解决在有限标记数据场景下的提取式文本摘要任务,提出了一种基于 GPT-4 的基于提示的伪标签选择策略,通过使用 LLM 评估和生成伪标签,改进了不同数据集上的 ROUGE-1 指标 10-20%,减少了无标记样本数量。