In this paper, we present a kernel-based learning approach for the 2018
complex word identification (CWI) Shared Task. Our approach is based on
combining multiple low-level features, such as character n-grams, wi
本研究利用零样本、一次样本和少量样本学习技术,结合自然语言处理的最先进解决方案,通过使用四种不同语言(英语、德语、西班牙语和法语)的 CWI 共享任务数据集,证明了提出的模型可以在多语言环境中学习复杂单词的特征,并在零样本学习场景下在英语、德语和西班牙语三种语言中的宏 F1 分数上超过了现有的跨语言结果。同时,我们的模型也在德语(0.795 宏 F1 分数)的单语上表现出色。