BriefGPT.xyz
Ask
alpha
关键词
training data selection
搜索结果 - 4
小型语言模型能为较大语言模型选择调整训练数据
通过基于样本学习百分比的训练数据选择,我们展示了当前语言模型具备自主选择高质量训练数据的能力,这极大地降低了训练成本且达到或超过整个数据集训练的性能表现。
PDF
5 months ago
使用扩散模型进行无偏面部合成:我们已经达到目标了吗?
利用定性和定量指标以及用户研究,本论文主要研究了生成模型在面部图像生成中的有效性和不足之处,并提出了一个框架来审核生成的面部图像的特征。通过对最先进的文本到图像扩散模型生成的面部进行应用,我们发现面部图像生成存在的限制包括对文本提示的忠实度
→
PDF
10 months ago
EMNLP
自监督神经机器翻译中的自主课程学习
该研究提供了有关 SSNMT 模型在训练期间进行采样选择的深入分析,证明了该模型能够自我选择越来越复杂和相关任务的样本,并执行去噪曲线,以提高提取和翻译性能。其中,相互监督信号的动态对提取和翻译性能至关重要。研究显示,使用 Gunning-
→
PDF
4 years ago
多域情感分析的数据选择策略
本文介绍了一个关于在情感分析中领域适应的研究。我们对领域相似度度量进行了广泛的研究,提出了新的表示方法、度量方法和数据选择。在推文和评论的大规模多领域适应设置中,我们评估了所提出的方法,并证明了它们一致地优于强随机和平衡的基线方法,而我们的
→
PDF
7 years ago
Prev
Next