Nov, 2019

文本简化中句子删除的话语层面因素

TL;DR本文基于一个大型英文文本简化语料库,对一种常见但鲜为人知的现象——句子删除进行了数据驱动的研究和预测,检查了与句子删除相关的各种文档和语篇因素,揭示了专业编辑为满足小学和初中教育标准而采用的不同策略,并利用自动化对齐数据训练了分类模型以预测句子被删除的可能性。研究发现语篇层面的因素为句子简化中的句子删除预测带来了挑战。