Apr, 2024

基于数据驱动的 Pareto 前缘学习的偏好采样

TL;DR通过数据驱动的偏好向量采样框架,灵活地调整采样分布参数,从而实现高概率从 Pareto 前沿位置采样偏好向量,并且通过使用混合狄利克雷分布来改进模型在不连通 Pareto 前沿中的性能。