BriefGPT.xyz
Ask
alpha
关键词
self-influence scores
搜索结果 - 2
EMNLP
自我引导的数据重新加权用于语言模型预训练
我们提出了 PRESENCE 方法,通过利用自我影响(SI)得分作为样本重要性和预训练的指标来共同重新加权样本,从而促进模型预训练的新颖性和稳定性,填补了在预训练语言模型中采用模型驱动的样本重新加权的重要领域的空白。
PDF
8 months ago
让每个样本都有价值:自我影响在学习嘈杂自然语言处理数据中的稳定性与效用
本文研究使用任务不可知的自我影响分数对训练数据进行清洗的有效性,通过分析其在捕捉自然异常值方面的功效来调查自我影响数据清洗对机器翻译、问答和文本分类等任务的改进程度,利用自我影响计算的最新方法和自动课程学习作为基础。
PDF
a year ago
Prev
Next