BriefGPT.xyz
Ask
alpha
关键词
training data subset selection
搜索结果 - 2
ICLR
VTruST: 基于可控价值函数的数据中心可信 AI 的子集选择
提出了一种基于数据的可控信任 AI(DCTAI)框架 VTruST,该框架允许用户控制构建训练数据集时信任度指标之间的权衡,通过提出一种在线值函数为基础的训练数据子集选择算法来实现高效的 DCTAI 框架。实验结果表明,VTruST 在社交
→
PDF
4 months ago
INGENIOUS: 使用信息丰富的数据子集高效预训练大型语言模型
通过使用具有高度信息量的训练数据子集训练预训练语言模型,同时保持下游性能,我们展示了如何利用子模块优化来选择高度代表性的训练语料库子集,以有效地训练多个预训练语言模型。
PDF
a year ago
Prev
Next