BriefGPT.xyz
Ask
alpha
关键词
alpha-entmax
搜索结果 - 3
ACL
加速 Entmax
本文研究了针对语言处理中神经网络常用的 softmax 在文本生成中出现的问题,提出了一种替代 alpha-entmax 的方法,并在机器翻译任务中取得了与 alpha-entmax 相当或更好的性能。
PDF
3 years ago
稀疏和连续的注意机制
本文将 alpha-entmax 方法扩展到连续域,同时提出了基于连续域注意机制的梯度反向传播算法,并通过在文本分类、机器翻译和视觉问答方面的实验表明了连续注意力机制的应用。
PDF
4 years ago
EMNLP
自适应稀疏变压器
介绍了自适应稀疏转换器,使用 α-entmax 代替 softmax,可以适应性地学习头部偏爱的结构,并改善了 softmax 转换器在机器翻译数据集上的可解释性和头部多样性。
PDF
5 years ago
Prev
Next