EMNLPDec, 2022

MANTIS 参加 TSAR-2022 共享任务:基于预训练编码器的无监督词汇简化改进

TL;DR该研究是关于 TSAR-2022 共享任务中字词简化的贡献,采用 RoBERTa 转换器语言模型扩展了无监督识别的词汇简化系统,通过采取一系列特征加权方案和基于文本蕴含的简化筛选方法,提高了系统的性能表现达 5.9%的精度,排名第二。