BriefGPT.xyz
Ask
alpha
关键词
universal transformer
搜索结果 - 3
稀疏通用变压器
提出了 Sparse Universal Transformer (SUT),利用稀疏专家混合(SMoE)和基于断裂棒的动态终止机制来减少 UT 的计算复杂性,同时保持其参数效率和泛化能力。实验证明,SUT 在 WMT'14 上仅使用一半的
→
PDF
9 months ago
ACL
自动生成排名的俄语改述语料库用于文本生成
本文是关于用于俄语释义生成的大规模语料库进行自动开发和排名的,提出了 ParaPhraser Plus 数据集以解决目前该领域小规模的语料库难以在文本生成中应用的问题,并使用 Universal Transformer 架构进行了实验。
PDF
4 years ago
ICLR
通用变压器
Universal Transformer 是一种并行自我关注循环序列模型,它将前馈序列模型(例如 Transformer)的并行性和全局感受野与递归的归纳偏差相结合,解决了在某些简单任务中标准 Transformer 失败的问题,并取得诸
→
PDF
6 years ago
Prev
Next