Apr, 2022

gTLO:通用的、非线性的多目标深度强化学习方法

TL;DR本研究提出了一种旨在将非线性MORL与广义MORL的优势相结合的新方法——广义阈值词典排序(gTLO),并在非线性MORL的标准基准和制造过程控制领域的实际应用中,介绍了该算法的深度强化学习实现,并取得了令人鼓舞的结果。