Jun, 2022

泰语中的拼写错误语义

TL;DR本文介绍一种 fine-grained 标注的泰语拼写错误语料库,并分析其潜在语义,研究了拼写错误出现的模式,提出了两种方法来融合拼写错误的语义,即 Misspelling Average Embedding (MAE) 和 Misspelling Semantic Tokens (MST),在情感分析任务上实验证明了拼写错误的附加语义可以提高微 F1 分数,而盲目归一化则是有害和次优的。