Jun, 2023

划分、征服和组合:零样本对话状态跟踪的不受语义限制专家混合

TL;DR本文提出了一种简单有效的“划分、攻克和合并”解决方案,明确解开已知数据的语义,并利用专家的混合机制来提高零-shot DST性能和鲁棒性。 在T5-Adapter上对MultiWOZ2.1进行的大量实验表明,该架构显着且持续地提高了零-shot性能,在没有外部知识的情况下,只需10M可训练参数,实现了SOTA。