BriefGPT.xyz
Ask
alpha
关键词
representation degeneration
搜索结果 - 3
ACL
自注意力中的各向异性
通过实证观察,本文展示了基于 Transformer 的语言模型和其他模态下的 Transformer 存在的角度距离接近的问题,即各向异性问题。
PDF
6 months ago
ACL
Transformer 模型中的各向异性是否固有?
本文探讨了 self-supervised learning 方法在 transformer 架构的模型中出现的表示退化问题,提到了表征中的各向异性现象,并且指出该问题在表示学习、自然语言处理等领域都具有普适性。
PDF
a year ago
多语种机器翻译中的数据不平衡和表示退化缓解
提出了一个名为 Bi-ACL 的框架,旨在解决多语言神经机器翻译中的数据不平衡和表示退化问题。该框架使用仅目标侧单语数据和双语词典,结合双向自编码器和双向对比学习模块,并使用在线约束波束搜索和课程学习采样策略。实验表明,该方法对长尾语言和高
→
PDF
a year ago
Prev
Next