使用 1 - 局部会员查询进行学习
本文提出了一种新的分布学习模型,即在分布数据的随机样例附近进行局部查询来学习,并证明在该模型下,一些多项式和决策树相关的问题可以通过局部查询在多项式时间内进行学习。
Nov, 2012
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
May, 2024
本文介绍一种使用合成数据进行少样本分类的方法,该方法可以分类高维真实世界数据集,并将其应用于以前未见的自然语言处理任务中,使用软标签原型和修改的 k 近邻分类器进行分类,结果表明该方法可以在少数样本下进行分类,甚至超越了更复杂的 few-shot 学习方法。
Oct, 2022
本文主要探讨了在低资源环境下运用主动学习来提高机器翻译系统的翻译质量,使用流式主动学习提高翻译质量,通过动态组合多种查询策略,使用预测和专家建议来决定最优策略。通过实验证明,在更少的人工干预下,使用主动学习可以收敛到最好的机器翻译系统。
Mar, 2022
该研究运用天赋先验直接模拟人类在抽象视觉任务(例如字符 / 涂鸦识别)中的基本天赋先验,使得机器学习可以在类似于人类只使用很少的样例和预训练的情况下进行泛化,并保持和人类人类识别率相同。
Jan, 2022
本文提出一种基于向量特征表示的问题回答方法,使用弱监督资源训练,并结合了优化过的随机梯度下降和微调步骤,实现了在基于弱标注数据下,对知识库回答表现的显著提升。
Apr, 2014
大型语言模型在我们日常生活中的嵌入中引起了关于它们所学习的数据集的问题,包括潜在的偏见或误导信息以及人类生成文本的版权和合理使用问题。我们引入了实际应用于大型语言模型的文件级成员推断任务,并展示了我们的方法在准确确定文档级成员方面的优越性,增加了即将改变我们生活的技术的透明度。
Oct, 2023