BriefGPT.xyz
Ask
alpha
关键词
context-aware word representations
搜索结果 - 1
EMNLP
自适应稀疏变压器
介绍了自适应稀疏转换器,使用 α-entmax 代替 softmax,可以适应性地学习头部偏爱的结构,并改善了 softmax 转换器在机器翻译数据集上的可解释性和头部多样性。
PDF
5 years ago
Prev
Next