Jun, 2024

深度$F_1$:通过度量语义泛化性提高跨领域文本分类评估

TL;DR该研究介绍了一种新颖的跨领域文本分类性能度量标准Depth F1,用于评估模型在源域和目标域之间的语义泛化能力,该标准衡量了模型在与源域高度不相似的目标样本上的表现。通过在几个最新的跨领域文本分类模型上进行基准测试,旨在促进对跨领域文本分类模型的语义泛化能力进行深入评估。