BriefGPT.xyz
Ask
alpha
关键词
training duration
搜索结果 - 3
语言模型的物理学:第 3.3 部分,知识容量的规模律
通过多个受控数据集,我们建立了一种语言模型可以存储每个参数 2 比特知识的估计方法。此外,我们介绍了关于训练持续时间、模型体系结构、量化、稀疏约束以及数据信噪比如何影响模型的知识存储能力的 12 个结果。
PDF
3 months ago
在小波域中的语音扩散模型加速:一种简单高效的方法
我们通过将生成目标定向到小波领域,将自波领域生成模型的训练和推理速度提升一倍,在语音合成任务中实现与原模型相媲美或更高的性能,并且证明了该方法的多功能性。
PDF
5 months ago
EMNLP
所有良好的词向量空间都同构吗?
研究跨语言字向量空间对齐的算法,证明非同构空间不一定是由于语言间的类型差异,而是受到单语资源的大小和单语训练的影响,尤其是训练不充分的影响。
PDF
4 years ago
Prev
Next