EMNLPOct, 2020
Char2Subword:利用强健的字符组合扩展子词嵌入空间
Char2Subword: Extending the Subword Embedding Space Using Robust Character Compositionality
Gustavo Aguilar, Bryan McCann, Tong Niu, Nazneen Rajani, Nitish Keskar...
TL;DR提出一种基于字符的子词模块 (char2subword),它可以学习预训练模型 (BERT) 中的子词嵌入表,并通过预训练进一步集成到 BERT 中,从而显著提高在社交媒体语言代码切换评估 (LinCE) 的表现。