BriefGPT.xyz
Ask
alpha
关键词
locally normalized models
搜索结果 - 1
ICLR
文本生成的残留能量模型
本文探讨了基于序列级别的未标准化的能量模型应用于文本生成,通过在预训练的局部标准化语言模型的残差范围内工作,结合噪声对比估计来训练,同时利用 BERT 和 RoBERTa 等预先训练的双向上下文表示,结果表明在二个大型语言建模数据集上,残差
→
PDF
4 years ago
Prev
Next