ICMLJun, 2023

BatchGFN: 批量主动学习的生成流网络

TL;DRBatchGFN 使用生成流网络来采样比例为批量奖励的数据点集,可构建高度信息化批次用于主动学习,在玩具回归问题中,通过适当的奖励函数以单次前向通过批次中的每个点,取样接近最优效用批次,最大化批次奖励的贪婪近似已不再需要。同时,我们还提出了跨获取步骤的分摊训练的初步结果,这将使其能够扩展到真实世界的任务。