Apr, 2024

基于生成模型的强化学习与紧凑支持集

TL;DR使用强化学习作为对基础模型的控制的框架,通过生成小而专注的合成支持集来增强神经网络模型在真实数据分类任务上的性能,而无需额外的标记或数据成本。