R2 效用的多目标优化

May, 2023

Multi-Objective Optimization Using the R2 Utility

Ben Tu, Nikolas Kantas, Robert M. Lee, Behrang Shafei

TL;DR该研究探讨了一种使用标量化函数来转化多目标优化问题为单一目标优化问题的方法，其中使用了一种称为 R2 效用函数的目标函数解决了这些问题，并且该函数还可以利用贪心算法进行有效优化。

Abstract

The goal of multi-objective optimization is to identify a collection of points which describe the best possible trade-offs between the multiple objectives. In order to solve this vector-valued optimization problem, practitioners often appeal to the use of →

multi-objective optimization scalarization functions single-objective optimization r2 utility function bayesian optimization

发现论文，激发创造

基于标量化的风险概念的鲁棒多目标优化

基于鲁棒优化的多目标问题，介绍了鲁棒化和标量化两种关键操作之间的哲学差异，展示了风险概念在鲁棒多目标优化问题中的集成，并通过两个基于真实数据集的案例研究验证了这些新思路的有效性。

May, 2024

基于随机标量化的多目标贝叶斯优化的灵活框架

本文提出了一种基于随机标量化策略的多目标优化方法，可快速、灵活地从 Pareto 前沿的特定区域中采样，且在多项真实问题和合成问题的实验中显示了良好表现。

May, 2018

R-MBO: 多目标贝叶斯优化中偏好融入的多重替代方法

使用多目标贝叶斯优化方法，利用广义值分布来建立多独立 surrogate 模型（多 surrogates 方法），以解决现实问题中使用 scalarising 函数建立单一 surrogate 模型的限制。

Apr, 2022

多目标序贯决策调查

本文调查了设计用于带有多个目标函数的顺序决策问题的算法。通过分类法，将对多目标方法的文献研究按适用的设定情况、标量化函数的属性和考虑的策略类型进行分类。总之，文章总结了关键应用和未来研究机会。

Feb, 2014

多目标 QUBO 求解的标量化技术研究

本篇研究探讨将多个目标转化为单一目标的方法，在集合约束均值 - 方差投资组合优化问题上，迭代填充帕累托前沿中最大空间的方法可以显著提高性能。

Oct, 2022

R2 指标与深度强化学习增强的自适应多目标进化算法

提出了一种基于强化学习的双深度 Q 网络优化算法结构，通过使用 R2 指标将单目标结构转化为多目标结构，以及通过评估每代算法的性能构建强化学习奖励函数，该算法在与其他基于 R2 指标的六种算法进行比较时表现出优秀的性能。

Apr, 2024

多目标优化中的平滑切比雪夫标量化

本文通过平滑优化技术，提出了一种新颖且轻量级的光滑 Tchebycheff 标量化方法，用于基于梯度的多目标优化问题，具有良好的理论性质，能够以较低的计算复杂度找到符合有效权衡偏好的所有 Pareto 解。实验结果充分证明了我们提出方法的有效性。

Feb, 2024

多目标推荐的多元策略学习

多目标权衡时，推荐系统中的标量化方法决定最终用于排序的加权平均奖励信号，本研究对该方法进行了扩展以优化长期用户保留或增长的综合奖励，使用连续多元动作空间的策略学习方法，并提出了修正措施，通过模拟、离线和在线实验验证了方法的有效性。

May, 2024

基于 UCB 驱动的多目标增强学习的效用函数搜索

基于多目标强化学习的分解方法，通过使用多个效用函数将多目标问题分解为单目标问题，采用上限置信区间的方法在学习过程的不同阶段高效搜索最有前景的权重向量，以最大化 resulting Pareto front 的超体积。

May, 2024

基于效用的强化学习：统一单目标与多目标强化学习

通过引入基于效用的范式，将多目标强化学习的研究扩展到单目标强化学习领域，探讨了多策略学习、风险感知强化学习、折扣率以及安全强化学习等方面带来的潜在益处，并研究了采用基于效用的方法所带来的算法性能影响。

Feb, 2024