EMNLPNov, 2022

上下文学习的主动样本选择

TL;DR通过示例展示了大规模语言模型通过上下文学习实现各种任务的强大能力,为解决示例选择的不稳定性问题,提出了一种基于强化学习的算法用于识别泛化策略,以选择最佳示例以提高模型性能和泛化能力。