使用 1 - 局部会员查询进行学习 | BriefGPT

Dec, 2015

使用 1 - 局部会员查询进行学习

Learning Using 1-Local Membership Queries

Galit Bary

TL;DR该研究旨在解决人工标注数据的不足之处，提出了一种新的局部会员查询模型，以解决在机器学习和自然语言处理任务中的动态标记问题，并通过实验证明了这种方法的实用性。

Abstract

Classic machine learning algorithms learn from labelled examples. For example, to design a machine translation system, a typical training set will consist of English sentences and their translation. There is a stronger model, in which the algorithm can also query for labels of new exam

machine learning membership queries translation task local queries nlp task

发现论文，激发创造

使用本地成员查询进行学习

本文提出了一种新的分布学习模型，即在分布数据的随机样例附近进行局部查询来学习，并证明在该模型下，一些多项式和决策树相关的问题可以通过局部查询在多项式时间内进行学习。

Nov, 2012

从第一原理推导的成员推断攻击

本文针对成员推断攻击，提出了一种基于似然比的攻击方法，并认为攻击应该在低误报率下进行评估，发现以往攻击方法在该评估指标上表现欠佳。

Dec, 2021

简单问题的主动学习

我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系，并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别，我们展示了更强的结果，包括计算效率和对未知数据集的适应性。

May, 2024

利用软标签原型从少量示例中学习新任务

本文介绍一种使用合成数据进行少样本分类的方法，该方法可以分类高维真实世界数据集，并将其应用于以前未见的自然语言处理任务中，使用软标签原型和修改的 k 近邻分类器进行分类，结果表明该方法可以在少数样本下进行分类，甚至超越了更复杂的 few-shot 学习方法。

Oct, 2022

使用比较查询进行主动分类

研究一种扩展主动学习的方法，其中学习算法可以要求注释者比较两个示例与其标签类边界的距离，并使用半空间的框架展示这种方法的优越性。

Apr, 2017

Onception: 面向真实世界机器翻译的专家建议主动学习

本文主要探讨了在低资源环境下运用主动学习来提高机器翻译系统的翻译质量，使用流式主动学习提高翻译质量，通过动态组合多种查询策略，使用预测和专家建议来决定最优策略。通过实验证明，在更少的人工干预下，使用主动学习可以收敛到最好的机器翻译系统。

Mar, 2022

通过对抗示例进行成员推断攻击

本文研究机器学习与深度学习对隐私的威胁，提出了一种测量训练数据泄露的方法以及针对成员推断攻击的新型防御机制，并通过实验数据支持了研究的结论。

Jul, 2022

从一次学习中学习

该研究运用天赋先验直接模拟人类在抽象视觉任务（例如字符 / 涂鸦识别）中的基本天赋先验，使得机器学习可以在类似于人类只使用很少的样例和预训练的情况下进行泛化，并保持和人类人类识别率相同。

Jan, 2022

基于弱监督嵌入模型的开放式问答

本文提出一种基于向量特征表示的问题回答方法，使用弱监督资源训练，并结合了优化过的随机梯度下降和微调步骤，实现了在基于弱标注数据下，对知识库回答表现的显著提升。

Apr, 2014

大脑细胞读了你的书吗？针对大型语言模型的文档级成员推断

大型语言模型在我们日常生活中的嵌入中引起了关于它们所学习的数据集的问题，包括潜在的偏见或误导信息以及人类生成文本的版权和合理使用问题。我们引入了实际应用于大型语言模型的文件级成员推断任务，并展示了我们的方法在准确确定文档级成员方面的优越性，增加了即将改变我们生活的技术的透明度。

Oct, 2023