基于数据驱动的 Pareto 前缘学习的偏好采样
通过进化好性采样 (Evolutionary Preference Sampling,EPS) 策略,将其融入到五种高级 Pareto Set Learning (PSL) 方法中,该论文提出了一种有效的样本优先选择向量,实现了对 Pareto 集合的快速收敛速度。
Apr, 2024
提出了一种使用动态损失函数来进行多目标训练神经网络以逼近 Pareto 前沿的新方法,在三个多目标问题上的实验表明,本方法无需预先指定权衡向量即可以返回分布在不同权衡方案上的输出,并且与现有技术相比具有更多的优势,尤其是对于非对称 Pareto 前沿。
Feb, 2021
提出 PHN-HVI 框架,利用超网络从多样化的权衡偏好生成多个解并最大化这些解定义的超体积指标以提高 Pareto 前沿的质量,在多个 MOO 机器学习任务上实验结果表明,与基线方法相比,该框架显著提高了产生权衡 Pareto 前沿的性能。
Dec, 2022
本研究提出一种直接在特征空间中根据偏好条件来调整神经网络的多目标优化方法,通过对解决方案进行惩罚来维持小角度到偏好向量的方法确保了良好分布的 Pareto 曲线,实验证明我们的 Pareto 前缘尽管计算速度显著更快,但也达到了业内最先进的质量,并展示了其可扩展性。
Mar, 2021
该研究采用 Pareto HyperNetworks(PHNs)实现了 Pareto-Front Learning(PFL),它通过一个超网络同时学习并输出 Pareto 前沿,并且相比于训练多个模型,该方法具有更高的运行时效率,并可以根据运行时的偏好选择特定模型。
Oct, 2020
本文通过神经组合优化的思想,提出了多目标组合优化问题的学习方法,模型可直接生成逼近帕累托前沿的解,证明了该方法在多目标问题上的有效性。
Mar, 2022
提出了一种新的、高效的方法,可以生成局部连续的 Pareto 集和 Pareto fronts,并将其应用于现代机器学习问题中。通过提出基于样本的稀疏线性系统,将多目标优化的理论结果扩展到现代机器学习问题中,并实现了局部 Pareto 集的分析。与现有算法相比,通过在各种多任务分类和回归问题上的应用,证明了我们的算法在平衡权衡、有效地找到更多的不同权衡解以及迎合百万级参数任务的能力。
Jun, 2020
通过极坐标,我们证明了帕累托前沿可以显式地参数化,从而基于此表示可以将线性代数、概率统计和决策理论推广至帕累托前沿空间中的函数。我们以随机设置为重点,研究了帕累托前沿作为随机过程的情况,并展示了如何定义和估计期望值、协方差和分位数等统计量。同时,我们还通过设计实验探讨了如何利用帕累托前沿表面分布来做出有效决策,并在极值理论的背景下展示了帕累托前沿思想的应用。最后,我们通过对实际空气污染数据集的数值示例,应用了我们的新方法。
May, 2024
使用基于偏好的后验采样和贝叶斯方法解决了强化学习中的信用指派问题,提出了一种新的算法 DUELING POSTERIOR SAMPLING(DPS),并且给出了第一个关于基于偏好的 RL 的后验保证率。
Aug, 2019
使用梯度信息和基于策略的方法在多目标 MDP 中学习连续的 Pareto 边界序列,通过跟踪单个梯度上升运行来生成解决方案。
Jun, 2014