Jan, 2022

轨迹平衡:GFlowNets 中改进的信用分配

TL;DR该文研究了生成流网络中的学习策略,提出了一种更有效的学习目标 - trajectory balance,并在实验中验证了其提高生成样本多样性和网络收敛性的效果。