BriefGPT.xyz
Ask
alpha
关键词
preference vectors
搜索结果 - 1
基于数据驱动的 Pareto 前缘学习的偏好采样
通过数据驱动的偏好向量采样框架,灵活地调整采样分布参数,从而实现高概率从 Pareto 前沿位置采样偏好向量,并且通过使用混合狄利克雷分布来改进模型在不连通 Pareto 前沿中的性能。
PDF
3 months ago
Prev
Next