多目标序贯决策调查

Feb, 2014

A Survey of Multi-Objective Sequential Decision-Making

Diederik Marijn Roijers, Peter Vamplew, Shimon Whiteson, Richard Dazeley

TL;DR本文调查了设计用于带有多个目标函数的顺序决策问题的算法。通过分类法，将对多目标方法的文献研究按适用的设定情况、标量化函数的属性和考虑的策略类型进行分类。总之，文章总结了关键应用和未来研究机会。

Abstract

sequential decision-making problems with multiple objectives arise naturally in practice and pose unique challenges for research in decision-theoretic →

sequential decision-making multiple objectives planning learning scalarization function

发现论文，激发创造

多目标强化学习与规划实用指南

本文为那些希望将多目标方法引入其研究的已经熟悉单目标强化学习和计划方法的研究人员以及在实践中遇到多目标决策问题的从业人员提供了一个解决复杂问题的指南，阐述了影响所需解决方案性质的因素，并通过示例说明了这些因素如何影响复杂问题的多目标决策系统的设计。

Mar, 2021

多目标策略优化的分布式视角

本文提出了一种用于多目标强化学习的新算法，可以以一种无量纲的方式设置目标的偏好，并且通过学习行动分布和拟合参数策略来在高维实际机器人任务及模拟任务中展示了其有效性，从而找到一组非支配解空间。

May, 2020

基于随机标量化的多目标贝叶斯优化的灵活框架

本文提出了一种基于随机标量化策略的多目标优化方法，可快速、灵活地从 Pareto 前沿的特定区域中采样，且在多项真实问题和合成问题的实验中显示了良好表现。

May, 2018

多目标数据驱动决策流程的差异化

基于多目标决策的方法在解决实际中的数据驱动优化问题方面表现出色。

Jun, 2024

多目标机器学习中的泛化能力

本文研究多目标学习，建立其基础的泛化界限，分析真实目标和经验逼近目标的帕累托最优解之间的关系，同时发现存在对应的对称关系。

Aug, 2022

帕累托前沿之外的探索：多目标优化决策支持方法综述

我们提供了一个综述，统一了多目标优化算法产生的解决方案的决策支持方法。我们提供这个主题的最新进展的概述，包括可视化方法、解决方案集挖掘、不确定性探索以及新兴研究方向，包括交互性、可解释性和伦理。我们综合了来自不同研究领域的这些方法，构建了一个独立于应用的统一方法。我们的目标是降低研究人员和实践者使用多目标优化算法的门槛，并提供新的研究方向。

Nov, 2023

基于多目标的深度学习参数优化调查

本研究探讨了多目标优化策略与深度神经网络结合的有效性，通过案例研究证明了该方法在多种应用程序中生成预测和分析方面具有价值。

May, 2023

在严重不确定情况下进行多目标决策

本文将近期发展的决策理论的不完全偏好和概率信息转移到多目标设置中，并通过利用可能的部分基数和部分概率信息，比帕累托序提供更详细的订单来比较决策。我们讨论了所提议的决策选项之间的一些有趣属性，并展示了如何通过线性优化来计算它们。最后，在比较不同表现度量下的算法的场景中演示了我们的框架。

Dec, 2022

帕累托集上的优化：多目标优化理论

在多目标优化中，考虑到平衡多个目标之间的权衡，解决方案在最优权衡方面被称为帕累托最优；我们研究了解决帕累托集约束优化问题的本地方法，这是一个具有挑战性的问题，因为约束集不仅是隐式定义的，而且通常在目标函数是非凸非光滑的情况下。

Aug, 2023

多任务学习的多目标优化

本论文将多任务学习作为多目标优化来解决，并提出了一种基于梯度下降优化算法的上限边界，证明了在现实情况下优化这个上限边界将得到帕累托最优解，在多任务深度学习问题上应用我们的方法表现出比最近的多任务学习公式或每项任务训练的模型更高的性能。

Oct, 2018