COLINGMar, 2024

让句子嵌入对用户生成的内容具有强大的适应性

TL;DR通过使用教师 - 学生方法,在标准和合成 UGC-like 数据集上训练 RoLASER,可以显著提高 LASER 模型对自然和人工 UGC 数据的鲁棒性,同时在标准数据上与 LASER 相媲美或更好,在 UGC 数据上始终优于 LASER。