BriefGPT.xyz
Ask
alpha
关键词
length-adaptive transformer
搜索结果 - 1
ACL
长度自适应 Transformer: 一次训练,随时使用,避免长度限制和搜索
本论文中提出了一种名为 Length-Adaptive Transformer 的方法,通过使用结构变体 dropout(LengthDrop)在一个转换器上一次训练即可在各种推理场景下使用,并使用多目标进化搜索查找在任何给定计算预算下最大
→
PDF
4 years ago
Prev
Next