多目标序贯决策调查
本文为那些希望将多目标方法引入其研究的已经熟悉单目标强化学习和计划方法的研究人员以及在实践中遇到多目标决策问题的从业人员提供了一个解决复杂问题的指南,阐述了影响所需解决方案性质的因素,并通过示例说明了这些因素如何影响复杂问题的多目标决策系统的设计。
Mar, 2021
本文提出了一种用于多目标强化学习的新算法,可以以一种无量纲的方式设置目标的偏好,并且通过学习行动分布和拟合参数策略来在高维实际机器人任务及模拟任务中展示了其有效性,从而找到一组非支配解空间。
May, 2020
本文提出了一种基于随机标量化策略的多目标优化方法,可快速、灵活地从 Pareto 前沿的特定区域中采样,且在多项真实问题和合成问题的实验中显示了良好表现。
May, 2018
我们提供了一个综述,统一了多目标优化算法产生的解决方案的决策支持方法。我们提供这个主题的最新进展的概述,包括可视化方法、解决方案集挖掘、不确定性探索以及新兴研究方向,包括交互性、可解释性和伦理。我们综合了来自不同研究领域的这些方法,构建了一个独立于应用的统一方法。我们的目标是降低研究人员和实践者使用多目标优化算法的门槛,并提供新的研究方向。
Nov, 2023
本文将近期发展的决策理论的不完全偏好和概率信息转移到多目标设置中,并通过利用可能的部分基数和部分概率信息,比帕累托序提供更详细的订单来比较决策。我们讨论了所提议的决策选项之间的一些有趣属性,并展示了如何通过线性优化来计算它们。最后,在比较不同表现度量下的算法的场景中演示了我们的框架。
Dec, 2022
在多目标优化中,考虑到平衡多个目标之间的权衡,解决方案在最优权衡方面被称为帕累托最优;我们研究了解决帕累托集约束优化问题的本地方法,这是一个具有挑战性的问题,因为约束集不仅是隐式定义的,而且通常在目标函数是非凸非光滑的情况下。
Aug, 2023
本论文将多任务学习作为多目标优化来解决,并提出了一种基于梯度下降优化算法的上限边界,证明了在现实情况下优化这个上限边界将得到帕累托最优解,在多任务深度学习问题上应用我们的方法表现出比最近的多任务学习公式或每项任务训练的模型更高的性能。
Oct, 2018