Jun, 2024

基于可读性引导的成语感知句子简化(RISS)对中文的应用

TL;DR通过结合数据增强技术和词汇简化,我们提出了一种名为RISS(Readability-guided Idiom-aware Sentence Simplification)的新框架,用于解决中文句子简化面临的挑战,包括缺乏大规模标记平行语料库和惯用语的普遍存在。RISS通过多阶段和多任务学习策略将RPS和IAS整合在一起,从而在两个中文句子简化数据集上优于先前的最先进方法。此外,在小型标记数据集上微调后,RISS还取得了进一步的改进。我们的方法展示了更加有效和可访问的中文文本简化的潜力。