Apr, 2022

汉语成语转述

TL;DR本文提出了中文成语改写(CIP)任务,以将包含成语的句子重新表述为不成语的句子并保留原本的意思,从而方便处理中文数据集和提高中文 NLP 任务的性能。本研究使用人与机器协作建立了一个包含 115,530 个句子对的大规模 CIP 数据集,并且使用三种基线模型和两种新方法,表现更好。