Oct, 2022
利用数据增强提高语言模型在分类法分类任务的泛化能力
UU-Tax at SemEval-2022 Task 3: Improving the generalizability of language models for taxonomy classification through data augmentation
Injy Sarhan, Pablo Mosteiro, Marco Spruit
TL;DR该研究介绍了利用 ELECTRA 语言模型和数据增广技术设计出的 UU-Tax 模型,在 SemEval-2022 的 PreTENS 子任务 1 中取得了 91.25% 的 F1_Binary 分数,并在子任务 2 中利用 Universal Sentence Encoder 提取特征进行分类,取得了 0.221 的 rho 分数。