关键词mixture-of-expert (moe)
搜索结果 - 2
- 快速训练极端掩码的扩散变压器用于三维点云生成
FastDiT-3D is a novel masked diffusion transformer designed for efficient generation of high-quality 3D point clouds, ac - 用于流式多语言 ASR 的专家混合 Conformer
提出了一种流式的、真正的多语言 Conformer 模型,其中融合了 MoE 层以提高推理效率,经在 12 种语言上评估,相对于基线获得 11.9% 的相对 WER 改进;在不使用语言信息的前提下,与使用 Ground Truth 信息的适