May, 2024

使用负载均衡和主叶节点增强快速前馈网络

TL;DR我们提出了将负载均衡和主叶技术融入快速前馈网络(FFFs)体系结构,以改善性能并简化训练过程。通过在文献中实现实验并展示使用这些技术增强的 FFF 模型的结果,我们发现所提出的架构和训练方法在训练和测试准确性方面相较于原始 FFF 架构分别提高了 16.3% 和 3% 的分类准确性。此外,与先前研究中报道的结果相比,我们观察到结果的变化较小。这些发现表明在 FFF 中整合受 Mixture of Experts 技术启发的技术可以开发出更准确和高效的模型。