BriefGPT.xyz
Ask
alpha
关键词
mixture-of-experts wait-k policy
搜索结果 - 1
EMNLP
混合专家等候 - k 策略的通用同时翻译机
本论文提出了一种基于 Mixture-of-Experts Wait-k 机制的通用即时翻译模型,采用多头注意力实现专家混合,每个专家根据其自己的等待词数被认为是 wait-k 专家,并根据测试延迟和源输入调整专家权重以产生最佳翻译,可以在
→
PDF
3 years ago
Prev
Next