Apr, 2017

一种稳健的逆优化效用学习框架

TL;DR使用鲁棒的参数效用学习框架,将用户交互建模为非合作博弈,并通过集成方法扩展来提高预测性能。应用于鼓励用户节能行为的社交游戏实验中,表现出良好的性能。