Aug, 2017

自然故事语料库

TL;DR为了比较人类语言处理模型,许多研究使用富自然语言材料的语料库来预测参与者反应,但这些研究所使用的许多语料库是基于自然文本的,因此缺少许多频率低的句法结构,而这些句法结构是区分处理理论所必需的。本文提出一种新的语料库,包含许多低频句法结构且易于被母语人士理解,该语料库已标注手动修正的语法树,并包括了自定速度阅读时间的数据。