Dec, 2021
认清优势:全面的对话状态跟踪诊断
CheckDST: Measuring Real-World Generalization of Dialogue State Tracking
Performance
Hyundong Cho, Chinnadhurai Sankar, Christopher Lin, Kaushik Ram Sadagopan, Shahin Shayandeh...
TL;DR通过我们的工具包 CheckDST,我们进行了标准化和全面的 DST 诊断,发现了不同类别的 DST 模型具有明显的优势和劣势,生成模型更适用于语言多样性,而基于跨度分类的模型对不可见实体更具鲁棒性,我们还发现了各个模型的失败模式,并通过预微调过程改善了生成模型的分布偏差问题。