Nov, 2022

基于超网络的专家混合模型用于领域泛化

TL;DR基于超网络的专家混合(MoE)方法被提出以解决域偏移问题且不需要域标签,并通过探索专家之间的低维向量相似性来共享有用的元知识,该方法在实验中表现出色,实现某些情况下的SOTA结果。