BriefGPT.xyz
Ask
alpha
关键词
non-parametric memory component
搜索结果 - 1
NIPS
开放词汇在线语言建模的无限缓存模型
提出了一种扩展连续缓存模型的方法,通过使用大规模的非参数内存组件,存储过去观察到的所有隐藏激活,并利用近似最近邻搜索和量化算法,高效地存储和搜索数百万的表示,显著提高了预训练语言模型在新分布上的困惑度,并且可以有效地扩展到比以前提出的本地缓
→
PDF
7 years ago
Prev
Next