Apr, 2022

Pareto Conditioned Networks

TL;DR本研究提出了一种名为 Pareto Conditioned Networks (PCN) 的方法,使用单一神经网络涵盖所有非支配策略,通过在特定的回报条件下进行训练,将优化问题转化为分类问题,实现对所需的 Pareto-efficient 解的策略恢复。