Feb, 2022

NU HLT 参加 CMCL 2022 共享任务:通用语言空间中多语和跨语人类阅读行为预测

TL;DR本文提出了一种适用于各种语言中单词阅读时间的多语言和跨语言预测的统一模型。通过使用国际音标将单词转换为通用语言表示,该模型的预处理步骤是成功的关键。该模型从基本频率、n-gram、信息论和心理语言学启发的预测变量中提取了各种特征,随后使用随机森林模型进行训练,实现了最佳表现。