如何控制文本简化? 对含义保持控制性简化的控制标记的实证研究
通过对句子语法和词汇约束的控制,本文提出了一种可以满足不同用户简化需求的 CROSS 句子简化模型,使用 Transformer-based 结构,在两个基准数据集上实验表明,语法和词汇约束对于成功的简化至关重要。
Oct, 2019
使用离散参数机制在序列到序列模型中为用户提供明确控制简化系统的方法,进而在简化基准测试中实现比标准模型更好的结果,并建立了 ACCESS 模型作为人群中心的句子简化的技术水平。
Oct, 2019
本研究提出了一种基于事实信息的控制简化方法,使用句法依赖分析将复合和复杂句子拆分为简化句子的集合,并用统计方法度量了句子的句法复杂度,通过本方法,可在不失信息的情况下简化语言,用于知识图谱中三元组的提取与构建。
Apr, 2023
提出了一种新型的混合方法,它结合了基于语言学的分裂和删除规则以及神经语言转换模型来进行不同的简化操作,并通过引入新的数据增强方法来提高模型的语言转换能力。通过自动和手动评估,证明该模型在对比现有系统时,产生了更多的语言转换,并且可以控制所应用的每个简化操作的程度。
Oct, 2020
该论文提出了一种能够精确控制文本长度的文本生成框架,可以生成指定数量的词语或句子的摘要,且在维持或提高文本质量的同时,通过联合训练模型预测长度,实现生成最佳长度的摘要。作者对该框架在 CNNDM 数据集上进行了评估,结果表明其性能优于现有方法。
May, 2023
文本简化和增加复杂性的任务是为了提高阅读理解的测试的复杂度控制而有限的。我们提出了一种新颖的可控阅读度的文本修改任务,其中通过生成 8 个不同目标阅读度级别的版本来实现对输入文本的阅读度的绝对修改。此任务的基准是使用 ChatGPT 和 Llama-2,引入了一个两步过程的扩展方法(通过两次经过语言模型的生成重述)。零样本方法能够将改写的阅读度推向所需方向,但最终的阅读度与原始文本的阅读度仍然存在相关性。我们还发现,阅读度的变化程度与源文本和目标文本之间的语义和词汇相似性的降低程度存在较大的相关性。
Sep, 2023
本研究旨在通过建立使用预训练语言模型的(心理)语言学特征的透明度较高的文本简化系统来提高可解释性和可控性,并利用提前设定的十种属性,拓展一种 Seq2Seq TS 模型,使其能够明确控制多个属性。实验证明我们的方法在解释复杂度预测方面表现优异,并且通过明确地将 Seq2Seq 模型的条件限制于十个属性,其性能在领域内外环境中均有显著提高。
Dec, 2022
自动文本简化(TS)旨在自动化重写文本的过程,使人们更容易阅读。本研究引入了人类评估框架以评估简化文本是否保留了含义,并通过阅读理解问题对文本进行了深入的人类评估和九种自动系统评估。
Dec, 2023