pairwise comparisons | BriefGPT

关键词pairwise comparisons

搜索结果 - 26

顺序对抗排序聚合：理论与算法
通过对强有力的潜在对手进行在线攻击，从博弈论的视角提出了一种关于排名聚合方法的对抗性操纵解决方案，并展示了如何通过顺序操纵策略在具有完全知识或不完全知识的 attackers 下实现最优效果。
PDF4 days ago
主动偏好学习用于样本内外排序项目
学习基于有噪声的配对比较的项目顺序，在无法分配具体标签的情况下很有用，尤其是在标注者必须进行主观评估的情况下。本研究在具有上下文属性的有序项目中研究了配对偏好反馈的主动学习，提出了两种算法来贪婪地最小化排序错误，证明了这些算法相对于非上下文
PDF2 months ago
用户更喜欢 Jpegli 而非同样大小的 libjpeg-turbo 或 MozJPEG
我们通过人工评比比较了由 MozJPEG、libjpeg-turbo 和我们的新 Jpegli 编码器所编码的 JPEG 图像。当图像质量接近 libjpeg-turbo 的 95 质量时，Jpegli 图像优于 libjpeg-turbo
PDF3 months ago
基于预测的大型语言模型排序
使用统计框架，我们可以以一定的概率保证，通过人类和强大的大型语言模型的成对比较排名结果覆盖了人类偏好的真实排名。
PDF4 months ago
基于配对偏好的公平主动排名
透过自适应调用两两比较来研究可能近似正确且公平（PACF）排名问题，目标是根据我们提出的公平目标函数找出一个（ϵ，δ）-PACF 排名。我们使用的目标函数要求最小化组的误差 lq 范数，其中组的误差是组内所有项误差的 lp 范数，p,q≥1
PDF5 months ago
奖励模型学习的偏好污染攻击
从两两比较中学习效用模型或奖励模型是许多应用领域的基础组成部分。我们通过攻击算法的两类不同方法，系统地研究了恶意攻击者通过改变偏好比较数据来达到其目的的潜在性与效果，发现最佳攻击通常能在污染数据仅占 0.3% 情况下取得 100% 的成功率
PDF5 months ago
自信特征排序
基于特征重要性值的排序和置信区间，提出一种后期重要性方法，用于选择前 k 个并具有高概率包含真实的（无限样本）排序。
PDFa year ago
通过限制求解的视角改善软件需求优先级排序
本文介绍了一种交互式方法来进行需求优先级排序，该方法利用了成对比较和约束求解器，该方法依赖于约束求解器的提议优先级方法在有效性和分析师错误的健壮性方面优于现有的交互式优先级方法，以卫生保健项目的需求为基础和来评估所提出的方法。
PDFa year ago
无需出价，无悔选择：基于成对反馈的数字商品与数据竞拍机制
本文提出了一种使用配对比较的机制设计，该机制设计针对变量质量的定制商品，在任何具有定制商品的场景中具有广泛适用性，并在多标签毒性注释数据上进行了实验。
PDFa year ago
普通图和局部图的成对比较排名
本文关注 Bradley-Terry-Luce 模型中的成对比较问题，并通过对图论的分析，提出了能够在有限条件下对排名进行准确估计的算法，并在大规模实验中证实了该算法的可行性。
PDFa year ago
ACLActive Evaluation: 用少量成对比较有效评估自然语言生成 (NLG)
本文介绍了一种名为 Active Evaluation 的框架，它可以通过使用对决式神经网络算法来主动地选择系统对进行比较，从而有效地降低手动注释的数量，并进一步提出了基于模型的对决式神经网络算法，将自动评估指标与人工评估相结合，从而进一步
PDF2 years ago
ICMLGNNRank：通过有向图神经网络从成对比较中学习全局排名
本研究利用神经网络提出了一个名为 GNNRank 的训练框架，用于从成对比较中恢复全局排名，该框架涉及一种排名得分估计方法以及一种形成可学习相似矩阵的图形构建方法，实验结果表明该方法能够获得优秀的性能和有希望的转移能力。
PDF2 years ago
ACL比平均水平更好：自然语言处理系统的成对评估
本 paper 探讨了语言处理领域中评估模型常使用的平均值等聚合方法存在的缺陷，并通过理论与实验证明采用基于对比的聚合方法如测量模型间比较的 Bradley-Terry（BT）模型可以更好的反映模型之间的差异。最后，研究提供了一个可供实用的
PDF3 years ago
AAAI异质 Thurstone 偏好模型在排名聚合中的应用
提议使用异构 Thurstone 模型（HTM）聚合排名数据，并提出一种基于交替梯度下降的排名聚合算法，能够同时估计不同用户的基础物品得分和准确度水平。理论上证明该算法的收敛速度线性，且表现优于现有方法。
PDF5 years ago
AAAI基于不确定性感知配对比较的鲁棒条件 GAN
本论文提出了一种新的生成对抗网络 (PC-GAN)，利用成对比较的弱监督来进行图像属性编辑，通过贝叶斯不确定性估计和抗噪声的对抗训练，PC-GAN 可以有效地估计属性评分，并在噪声抗性方面表现出出色的性能。在大量实验证明，PC-GAN 与完
PDF5 years ago
通过两两比较实现推荐排序中的公平性
本研究提出了一套度量算法公平性关注的新型指标，基于随机实验的成对比较来衡量公平性，建立了新的规则化器，促进了模型训练和推荐系统的公平性。
PDF5 years ago
约束最小二乘估计的 Goldenshluger-Lepski 方法在 RKHS 上的应用
研究一种自适应估计过程，在再生核希尔伯特空间（RKHS）回归的背景下称为 Goldenshluger-Lepski 方法，该方法使用所有数据产生非自适应的估算器，通过进行成对比较选择自适应估算器。
PDF6 years ago
特征排序：算法和图论分析
本文提出了一种新的概率偏好模型 f-BTL，它能更精确地推断带有特征的物品的偏好，在此基础上提出了一个新的最小二乘算法 fBTL-LS，其采样复杂度较低，依赖于物品的特征表述。这项工作展示了排名问题真正的复杂性，并证明了恢复潜在排名所需的样
PDF6 years ago
基于配对比较的近似排名
研究在机器学习中，基于两两比较对一组 n 个项目进行排名的问题，提出了一种基于置信区间的活跃排名算法，通过近似排序来减少比较次数。
PDF7 years ago
谱方法和正则化极大似然估计在 Top-K 排序中都是最优的
本文介绍一种基于 Bradley-Terry-Luce 模型的方法，使用 pairwise comparisons 进行 top-K ranking，证明 spectral method alone 和 regularized MLE al
PDF7 years ago