理解人类文本中的迭代式修订
本论文旨在构建一个端到端的文本修订系统,该系统可以通过显式检测可编辑范围及其对应的编辑意图并指导修订模型来迭代生成有用的编辑,从而更准确地模拟迭代文本修订的过程,并在我们的文本修订任务和其他标准文本修订任务上显著优于以前的基线,包括语法错误修正、文本简化、句子融合和风格转换。
Dec, 2022
本文提供了一个完整的计算框架,对科学写作中的文本修订进行了研究,通过构建一个新的带有金标准句子对齐的带注释语料库来揭示了科研人员修订论文的常见策略,并利用自动方法在文档、句子和单词级别上提取修订内容。
Oct, 2022
本文介绍了一种人机交互的迭代文本修订系统 (R3),该系统可提供高质量的文本修改建议,通过人机交互实现文档的迭代修订,从而使大语言模型在文本修订任务中发挥更大作用。
Apr, 2022
本文提出了一种基于 Transformer、掩蔽语言模拟和属性分类的迭代就地文本修订方法,可以实现无需平行数据的文本修订,并在两个典型的文本修订任务上实现了竞争性和甚至更好的性能。
Apr, 2022
本研究通过提出一种交互式文本生成设置,在其中用户通过向系统发出编辑现有文本的命令与系统进行交互,来解决神经文本生成中一次生成的局限性,并介绍了一种新的文本编辑任务。通过使用 Wikipedia 中的单句编辑构成了一个名为 WikiDocEdits 的数据集,使用基于 transformer 的模型在其中进行训练以提高其自动产生的成果和用户评估结果。在此基础上,本研究分别从经验和定性分析方面展示了该模型的性能表现。
Oct, 2020
本文介绍了一个基于 TETRA 语料库的文档级修订助手。我们探索了无需参考评估和可解释的方法来评估文档修订的质量。实验结果表明,即使修订的差异微小,经过微调的预训练语言模型也能够区分文档修订后的质量,这为未来探索自动文档修订模型和评估指标奠定了基础。
May, 2022
本文介绍了一个学生立论式作文之间的修改版本语料库,并对每个修订版本进行了评注,以评估其是否改善了论文质量,并开发了一个基于机器学习的模型来预测修订版本的改进情况,同时也展示了利用专家和非专家修订数据可提高模型性能的结果。
Sep, 2019
ArgRewrite V.2 是一个修订语料库,包含用于自动修订目标预测和标杆的注释的论证性修订,这些修订是在关于自动驾驶汽车的论证性文章的两个循环修订中收集的。
Jun, 2022
本文提出了一个文本编辑器,使用自动文本摘要为用户提供不断更新的逐段摘要,以边缘注释的方式帮助用户规划、结构化和反思写作过程。通过两个用户研究,作者发现这个系统为用户提供了一个外部的视角来帮助他们修改段落的内容和范围,并且帮助用户快速了解文本的总体情况和开发一些集成自动摘要中得到的见解的策略。通过探究和强调设计 AI 工具以帮助写作的价值,这项工作突显了自然语言处理 (NLP) 能够超越直接的文本生成和纠正。
Aug, 2022