Feb, 2024

MORL-Prompt: 多目标强化学习离散问题优化的实证分析

TL;DR基于强化学习的离散提示优化中,多目标方法直接优化体积效果更好,并且能够在所有奖励之间实现更好的平衡。