如何控制文本简化？对含义保持控制性简化的控制标记的实证研究

May, 2023

如何控制文本简化？对含义保持控制性简化的控制标记的实证研究

How To Control Text Simplification? An Empirical Study of Control Tokens for Meaning Preserving Controlled Simplification

PDF

Sweta Agrawal, Marine Carpuat

TL;DR本研究通过实证研究不同的控制机制对模型简化输出的适当性和简单性影响的方式，提出了一种简单的方法来预测控制令牌，以提高简化文本的质量。

Abstract

text simplification rewrites text to be more readable for a specific audience, while preserving its meaning. However, determining what makes a text easy to read depends on who are the intended readers. Recent work has introduced a wealth of techniques to control output →

text simplification control mechanism simplicity sentence level quality

发现论文，激发创造

可控的句子简化：应用句法和词汇约束

通过对句子语法和词汇约束的控制，本文提出了一种可以满足不同用户简化需求的 CROSS 句子简化模型，使用 Transformer-based 结构，在两个基准数据集上实验表明，语法和词汇约束对于成功的简化至关重要。

Oct, 2019

可控的句子简化

使用离散参数机制在序列到序列模型中为用户提供明确控制简化系统的方法，进而在简化基准测试中实现比标准模型更好的结果，并建立了 ACCESS 模型作为人群中心的句子简化的技术水平。

Oct, 2019

通过受控语法简化识别、测量和降低句法复杂性

本研究提出了一种基于事实信息的控制简化方法，使用句法依赖分析将复合和复杂句子拆分为简化句子的集合，并用统计方法度量了句子的句法复杂度，通过本方法，可在不失信息的情况下简化语言，用于知识图谱中三元组的提取与构建。

Apr, 2023

明确的复述控制文本简化

提出了一种新型的混合方法，它结合了基于语言学的分裂和删除规则以及神经语言转换模型来进行不同的简化操作，并通过引入新的数据增强方法来提高模型的语言转换能力。通过自动和手动评估，证明该模型在对比现有系统时，产生了更多的语言转换，并且可以控制所应用的每个简化操作的程度。

Oct, 2020

控制性文本压缩

本文提出了一个新的任务 —— 可控文本减缓 —— 来产生内容一致的文本，该任务的目标是生成一个有针对性的概括，重点关注标记的内容，并借助有监督学习方法进行实现。

Oct, 2022

精准长度控制摘要

该论文提出了一种能够精确控制文本长度的文本生成框架，可以生成指定数量的词语或句子的摘要，且在维持或提高文本质量的同时，通过联合训练模型预测长度，实现生成最佳长度的摘要。作者对该框架在 CNNDM 数据集上进行了评估，结果表明其性能优于现有方法。

May, 2023

上下文感知文档简化

本文研究探索了利用文档上下文进行文本简化的各种系统，并取得了最先进的性能，甚至不依赖于计划引导。

May, 2023

能否将文本修改为目标可读水平？使用零样本大型语言模型的初步研究

文本简化和增加复杂性的任务是为了提高阅读理解的测试的复杂度控制而有限的。我们提出了一种新颖的可控阅读度的文本修改任务，其中通过生成 8 个不同目标阅读度级别的版本来实现对输入文本的阅读度的绝对修改。此任务的基准是使用 ChatGPT 和 Llama-2，引入了一个两步过程的扩展方法（通过两次经过语言模型的生成重述）。零样本方法能够将改写的阅读度推向所需方向，但最终的阅读度与原始文本的阅读度仍然存在相关性。我们还发现，阅读度的变化程度与源文本和目标文本之间的语义和词汇相似性的降低程度存在较大的相关性。

Sep, 2023

(心理 -) 语言学特征与 Transformer 模型相遇：改进可解释和可控的文本简化

本研究旨在通过建立使用预训练语言模型的（心理）语言学特征的透明度较高的文本简化系统来提高可解释性和可控性，并利用提前设定的十种属性，拓展一种 Seq2Seq TS 模型，使其能够明确控制多个属性。实验证明我们的方法在解释复杂度预测方面表现优异，并且通过明确地将 Seq2Seq 模型的条件限制于十个属性，其性能在领域内外环境中均有显著提高。

Dec, 2022

文本简化系统是否保留含义？通过阅读理解的人工评估

自动文本简化（TS）旨在自动化重写文本的过程，使人们更容易阅读。本研究引入了人类评估框架以评估简化文本是否保留了含义，并通过阅读理解问题对文本进行了深入的人类评估和九种自动系统评估。

Dec, 2023

如何控制文本简化？ 对含义保持控制性简化的控制标记的实证研究

如何控制文本简化？对含义保持控制性简化的控制标记的实证研究