BriefGPT.xyz
Dec, 2023
所有未见数据都不属于分布外吗?
Are All Unseen Data Out-of-Distribution?
HTML
PDF
Songming Zhang, Yuxiao Luo, Qizhou Wang, Haoang Chi, Weikai Li...
TL;DR
在研究中,我们调查了训练数据的增加对测试数据中的泛化错误的影响,并将未观察到的数据分布定义为训练领域的凸包外的数据,提出了一种基于这一定义的新型泛化界限,并探索了数据增强和预训练等策略以解决这个问题,最后我们还提出了一种在源领域中的强化学习选择算法,能够比基线方法提供更好的性能。
Abstract
Distributions of unseen data have been all treated as
out-of-distribution
(OOD), making their generalization a significant challenge. Much evidence suggests that the size increase of
training data
can monotonical
→