理解人类文本中的迭代式修订

ACLMar, 2022

Understanding Iterative Revision from Human-Written Text

Wanyu Du, Vipul Raheja, Dhruv Kumar, Zae Myung Kim, Melissa Lopez...

TL;DR这项研究描述了 IteraTeR：第一个大规模、多领域、编辑意图注释的迭代修订文本语料库，包括了新框架和注释后的编辑意图，提高了自动生成模型的评价，从而更好地理解文本修订过程，使得编辑意图和写作质量之间可以建立重要联系，并促进迭代修订文本的计算模型的多样性语料库的创建。

Abstract

Writing is, by nature, a strategic, adaptive, and more importantly, an iterative process. A crucial part of writing is editing and revising the text. Previous works on text revision have focused on defining

text revision edit intention computational modeling corpus iterative process

发现论文，激发创造

通过学习从其他修订任务中编辑的位置来改进迭代文本修订

本论文旨在构建一个端到端的文本修订系统，该系统可以通过显式检测可编辑范围及其对应的编辑意图并指导修订模型来迭代生成有用的编辑，从而更准确地模拟迭代文本修订的过程，并在我们的文本修订任务和其他标准文本修订任务上显著优于以前的基线，包括语法错误修正、文本简化、句子融合和风格转换。

Dec, 2022

arXivEdits: 理解科学写作中的人类修订过程

本文提供了一个完整的计算框架，对科学写作中的文本修订进行了研究，通过构建一个新的带有金标准句子对齐的带注释语料库来揭示了科研人员修订论文的常见策略，并利用自动方法在文档、句子和单词级别上提取修订内容。

Oct, 2022

交互式文本摘要编辑

通过 REVISE 框架，将神经网络模型及人工编辑相结合，使得文本摘要的过程个性化，协作化和自适应化。

Jun, 2023

读、修改、重复：人类参与的文本迭代修订系统演示

本文介绍了一种人机交互的迭代文本修订系统 (R3)，该系统可提供高质量的文本修改建议，通过人机交互实现文档的迭代修订，从而使大语言模型在文本修订任务中发挥更大作用。

Apr, 2022

现场表示优化的文本修订

本文提出了一种基于 Transformer、掩蔽语言模拟和属性分类的迭代就地文本修订方法，可以实现无需平行数据的文本修订，并在两个典型的文本修订任务上实现了竞争性和甚至更好的性能。

Apr, 2022

指令式文本编辑

本研究通过提出一种交互式文本生成设置，在其中用户通过向系统发出编辑现有文本的命令与系统进行交互，来解决神经文本生成中一次生成的局限性，并介绍了一种新的文本编辑任务。通过使用 Wikipedia 中的单句编辑构成了一个名为 WikiDocEdits 的数据集，使用基于 transformer 的模型在其中进行训练以提高其自动产生的成果和用户评估结果。在此基础上，本研究分别从经验和定性分析方面展示了该模型的性能表现。

Oct, 2020

自动文档修订：语法错误纠正、流畅性编辑及更多

本文介绍了一个基于 TETRA 语料库的文档级修订助手。我们探索了无需参考评估和可解释的方法来评估文档修订的质量。实验结果表明，即使修订的差异微小，经过微调的预训练语言模型也能够区分文档修订后的质量，这为未来探索自动文档修订模型和评估指标奠定了基础。

May, 2022

句子级别修订改进的注释和分类

本文介绍了一个学生立论式作文之间的修改版本语料库，并对每个修订版本进行了评注，以评估其是否改善了论文质量，并开发了一个基于机器学习的模型来预测修订版本的改进情况，同时也展示了利用专家和非专家修订数据可提高模型性能的结果。

Sep, 2019

ArgRewrite V.2: 一个带标注的论证性修订语料库

ArgRewrite V.2 是一个修订语料库，包含用于自动修订目标预测和标杆的注释的论证性修订，这些修订是在关于自动驾驶汽车的论证性文章的两个循环修订中收集的。

Jun, 2022

超越文本生成：通过持续的自动文本摘要支持写手

本文提出了一个文本编辑器，使用自动文本摘要为用户提供不断更新的逐段摘要，以边缘注释的方式帮助用户规划、结构化和反思写作过程。通过两个用户研究，作者发现这个系统为用户提供了一个外部的视角来帮助他们修改段落的内容和范围，并且帮助用户快速了解文本的总体情况和开发一些集成自动摘要中得到的见解的策略。通过探究和强调设计 AI 工具以帮助写作的价值，这项工作突显了自然语言处理 (NLP) 能够超越直接的文本生成和纠正。

Aug, 2022