low data regime | BriefGPT - AI 论文速递

关键词low data regime

搜索结果 - 4

CheXpert5000 上现代架构和正则化方法的全面研究
本文通过对只有 5000 个样本图片的 CheXpert 数据集的医学图像分类进行现代架构的比较研究，发现在低数据实验中，以 ImageNet21k 为预训练数据集是可行的，并且较大的模型需要较少的训练步骤。同时，本文的研究验证了 MixU
PDFa year ago
个性化高斯过程联邦学习
pFedGP 基于高斯过程和深层核学习，旨在解决在低数据环境下学习跨客户有效性的挑战，通过学习跨客户的共享核函数以及个性化的 GP 分类器，在多个基准测试中实现了高度准确的状态，并在可靠性方面显着优于基准方法。
PDF3 years ago
内在维度解释语言模型微调的有效性
本文通过分析基于内在维度的微调现象，提出利用内在维度获取经验和理论直觉来解释当前预训练语言模型微调过程中的现象，然后通过实验证明了常规预训练模型具有极低的内在维度。最后，作者依靠低维任务表示和基于压缩的泛化界限将内在维度与泛化界限连接起来提
PDF4 years ago
DADA: 极低数据量分类的深度对抗数据增强
本文针对数据稀缺问题提出了一种基于生成式对抗网络的深度数据增广技术（DADA），该方法中新的判别器损失函数使得生成的数据样本能够帮助训练，并将 DADA 与传统增广、GAN 等方法比较实验证明，DADA 方法在实际情况中训练深度神经网络的泛
PDF6 years ago