Oct, 2023

通过单词的听觉信息提升混合编码文本处理能力

TL;DR通过使用来自SOUNDEX的单词的听觉信息,我们提出了一种处理混合编码文本的语言模型的有效方法(SAMLM),该方法包括基于掩码语言建模的预训练步骤,通过实验验证了SAMLM在处理混合编码任务中的鲁棒性和分类结果的改进。同时,我们使用SHAP进行解释,阐明了通过SAMLM引入的听觉特征如何有效地处理混合编码文本并增加了对对抗攻击的鲁棒性。