BriefGPT.xyz
大模型
Ask
alpha
关键词
data exploitation
搜索结果 - 4
ICCV
有限数据的自训练和多任务学习:目标检测评估研究
通过对教师训练数据不足的自训练目标检测和部分注释数据的多任务学习进行比较,验证了使用弱教师和未知数据训练多任务学生时性能的提高,表明多任务知识蒸馏和自训练的潜力,可为未来的研究提供帮助。
PDF
10 months ago
ACL
数据污染:从记忆到利用
本研究根据预训练语言模型在联合语料库上进行分析,发现在一些情况下存在信息的利用,但在其他情况下,模型只是纯粹地记住了数据,但并没有利用学到的知识,这两种情况受到了多重因素的影响,如污染数据的数量和模型的大小,在区分语言理解和数据利用方面,对
→
PDF
2 years ago
ICLR
不可学习的样本:使个人数据无法被利用
本文提出了一种错误最小化的噪声类型,可以防止深度学习模型从个人数据中学习,这种噪声对人眼不可见,可以应用于面部识别等实际场景,并在样本和类别形式下取得了实证效果,从而对防止数据滥用奠定了重要基础。
PDF
3 years ago
MM
线性码的主动深度解码
提出利用错误编码的数据进行深度学习模型训练的新方法,并结合加权置信传播算法(WBP)与活性学习技术,在不增加推理复杂度的情况下,通过精心采样数据成功改进 BCH (63, 36)、(63, 45) 和 (127, 64) 三个码的 WBP
→
PDF
5 years ago
Prev
Next