EMNLPOct, 2020

Char2Subword:利用强健的字符组合扩展子词嵌入空间

TL;DR提出一种基于字符的子词模块 (char2subword),它可以学习预训练模型 (BERT) 中的子词嵌入表,并通过预训练进一步集成到 BERT 中,从而显著提高在社交媒体语言代码切换评估 (LinCE) 的表现。