Apr, 2022

丹麦自然阅读眼动仪记录的哥本哈根语料库

TL;DR通过人们阅读时的眼动记录生成的语料库是自然语言处理的一种方式。我们介绍了 CopCo,这是丹麦语阅读的第一个眼动录音语料库,包括1,832个句子,34,897个单词,从演讲手稿中提取出的丹麦文本。该语料库的第一次发布包含来自22位参与者的眼动数据,通过数据质量评估发现所提取的特征与相关研究一致。