Nov, 2022

基于交互学习的个性化奖励学习(IGL)

TL;DR该研究提出了一种基于Interaction Grounded Learning(IGL)范式的方法,用于处理不同用户通信方式的多样性,从而实现对不同用户的个性化奖励函数学习,以直接优化潜在的用户满意度,实验结果表明该方法的成功应用。