BriefGPT.xyz
Ask
alpha
关键词
reference models
搜索结果 - 6
自适应主动自动机学习中的状态匹配和多重参考
主题:主动自动机学习;适应性学习;状态匹配;参考模型;样本复杂度;摘要:本文介绍了一种自动学习的新框架,它通过状态匹配提供了对参考模型结构的灵活使用,从而减少了自动学习的样本复杂度。实证评估表明,该适应性学习框架改进了当前的状态艺术水平约两
→
PDF
8 days ago
ICML
训练加速的多样化批次选择
现代机器学习模型对大型数据集的卓越成功往往需要大量的训练时间和资源消耗,为了节省成本,一种被广泛研究的方法是在线批次选择,在训练过程中选择信息量较大的子集。然而,现有的方法依赖于额外的参考模型,限制了它们的实际应用,因为这样理想的模型并不总
→
PDF
a month ago
sDPO:不要一次性使用您的数据
随着大型语言模型的发展,与人类偏好的对齐变得越来越重要。我们提出了逐步 DPO(sDPO),这是最近流行的直接偏好优化(DPO)的扩展。该方法涉及将可用的偏好数据集划分并以逐步方式利用,而非一次性使用。我们证明这种方法在 DPO 训练框架中
→
PDF
3 months ago
从状态轨迹中学习规划行动模型
通过学习状态轨迹开始,本文探索了在未提供学习动作参数时的学习情况,定义了两个追踪质量级别,并提出了相应的算法。实验评估表明,提出的算法相对于现有的学习工具 FAMA,速度更快,可以处理更大的输入,并提供更接近参考模型的学习动作模型。
PDF
5 months ago
低成本高效能的成员推理机制:提升关联性
我们提出了一种强大的成员推断攻击(RMIA),通过有效利用参考模型和参考数据的似然比检验来放大人口数据和目标模型之间的差异,与先前的方法相比,我们的算法在极低的假阳性误差率下(如 0)表现出卓越的测试功率(真阳性率)。同时,在计算约束条件下
→
PDF
7 months ago
子空间攻击:利用有前途的子空间进行查询高效黑盒攻击
本文介绍如何在黑箱攻击中利用参考模型的梯度来降低查询复杂度,提高黑箱攻击的效率和成功率,实验结果表明,与现有技术相比,本文提出的方法可以在查询数量上获得 2x 到 4x 的降低,并且具有更低的失败率。
PDF
5 years ago
Prev
Next