BriefGPT.xyz
Ask
alpha
关键词
cross-architecture generalization
搜索结果 - 4
通过实证研究提升数据集蒸馏的跨架构泛化能力
通过实证研究,本文提出了一种新颖的评估方法 ELF,通过利用蒸馏模型的中间层特征进行跨架构评估,从无偏重的知识中学习,以提高当前 DD 方法的跨架构泛化能力。
PDF
7 months ago
预训练模型是否能在数据集精炼中提供帮助?
数据集精炼(DD)是一种将大规模原始数据集的知识封装到小型合成数据集中进行高效训练的突出技术。与此同时,预训练模型(PTMs)作为知识库具有从原始数据集中获取的广泛信息。我们通过初步实验验证了 PTMs 对 DD 的贡献,然后系统研究了 P
→
PDF
9 months ago
探索多语言文本数据蒸馏
通过使用基于语言模型的学习方法,我们在多语言文本分类数据集上提出了几种数据蒸馏技术,来增强文本数据蒸馏领域中的跨体系结构泛化能力,并分析了它们在分类强度和跨体系结构泛化方面的性能,也研究了这些方法生成的数据摘要的语言特定公平性。
PDF
a year ago
CVPR
通过深度生成先验的数据集蒸馏泛化
Dataset Distillation technique using learned prior of deep generative models and a new optimization algorithm improves c
→
PDF
a year ago
Prev
Next