Jun, 2022

比较不同基于语言学的词嵌入在网络欺凌检测中的性能

TL;DR为了探究如何在词汇元素和结构之间获取更深的关系并过滤多余信息,我们提出了保留词素、句法和其他类型语言信息并结合原始 tokens 或 lemmas 的方法,从而训练出更精确的词向量,并将其应用于预训练的语言模型以提高其性能,为解决复杂的语言表达问题(如检测网络欺凌)提供帮助。