欧几里德偏好模型错误
本文提出了一种基于地标的策略,称为Landmark Ordinal Embedding(LOE),来解决现有的序数嵌入问题,通过利用潜在嵌入的低维度来平衡统计效率和计算效率,并在Bradley-Terry-Luce噪声模型下说明了LOE的统计一致性,并通过对计算复杂度进行严格分析,证明LOE在项目数量增加时明显比传统序数嵌入方法更高效。同时,本文还提出了一种实用的方法,利用LOE来热启动更具统计效率但计算代价较高的现有方法。
Oct, 2019
该论文研究了如何通过具有噪声的成对比较数据和项特征来估计排名,提出了凸显特征偏好模型,并使用最大似然估计学习模型参数和排名,实验证明了该模型表现强大,解释了系统性不对称性。
Feb, 2020
本文研究了从一群回答者中同时进行偏好和度量学习的问题,旨在捕捉单个用户的偏好和相似度度量标准,同时享有样本成本分摊。通过研究连续响应设置和噪声二进制测量,证明了该模型足够灵活,能够有效地满足不同需求,并提高了学习的样本复杂度,最终在模拟数据和真实数据中进行了实际效果验证。
Jul, 2022
本文探讨了在希尔伯特空间中度量学习和偏好学习问题,通过借助问题结构内在特性中诱导的内积的范数,获得了一种创新的代表定理,并演示了如何将其应用于三元组比较的度量学习任务,并显示出它对于这个任务的代表定理是简单且自包含的。在再生核希尔伯特空间的情况下,证明了解决学习问题的解可以使用核项表达,类似于经典的代表定理。
Apr, 2023
本研究针对将人类偏好视为二元且确定性的现有算法的不足,提出了分布式软偏好标签,并通过加权几何平均方法改进了直接偏好优化(DPO)。研究表明,该方法能够有效减轻过度优化问题,尤其在使用模糊标签的数据集上表现优越,促进了模型与人类偏好的更好对齐。
Sep, 2024
该研究解决了在成对偏好建模中无序性的问题,特别是高维情况下玩家间复杂无序性难以捕捉的挑战。论文提出了一种概率模型,能够共同学习每个玩家的高维表示及其特定的数据度量空间,并且通过额外的约束,模型能退化为先前的无序表示学习模型。研究表明,该方法在多个真实世界数据集上的预测性能优于现有竞争方法,具有重要的应用潜力。
Sep, 2024