BriefGPT.xyz
Ask
alpha
关键词
data sketching
搜索结果 - 2
数据肖像:记录基础模型训练数据
提出了 “数据肖像” 的概念,以记录训练数据,以增加模型训练的透明度并解决模型抄袭、数据泄漏等问题。作者采用数据草图技术实现了该方案,仅增加 3% 的额外开销,在大规模语言模型数据集上证明了该方案的有效性。
PDF
a year ago
有关算法子采样的计量经济学视角
这篇论文研究数据分析中的线性回归和数据素描技术,探讨在样本量有限的情况下如何选择行列子集对数据进行估计和推断,发现虽然算法上的优化子集无法适用于预测和推断,但通过统计学方法可以提供建议的子集大小,并通过实验表明,使用不同的子集来估计结果可以
→
PDF
5 years ago
Prev
Next