数据到文本自然语言生成的系统性综述

Feb, 2024

数据到文本自然语言生成的系统性综述

A Systematic Review of Data-to-Text NLG

Chinonso Cynthia Osuji, Thiago Castro Ferreira, Brian Davis

TL;DR系统综述研究数据到文本生成的现状，包括研究空白、未来方向、挑战以及对应措施，并提供了这个快速发展领域中未来研究的路线图。

Abstract

This systematic review aims to provide a comprehensive analysis of the state of data-to-text generation research, focusing on identifying research gaps, offering →

data-to-text generation research gaps future directions challenges roadmap

发现论文，激发创造

文本生成：任务、评估和挑战的系统文献综述

文本生成领域的文献回顾研究了 244 篇论文，将文本生成的工作分类为五个主要任务，并分析了相关特点、子任务和具体挑战。此外，研究还评估了目前的评估方法，并确定存在的问题。研究指出了九个主要挑战，并提供了详细分析和解决方案，以及进一步研究需求。该文献回顾面向自然语言处理领域的初级研究人员和有经验的研究人员。

May, 2024

神经数据转换为文本生成的创新

本文调查了神经元数据到文本生成的方法、基准数据集和评估协议，突出了技术应用阶段及其在自然语言生成领域中的前景。

Jul, 2022

自然语言生成中幻觉的调查

本文综述了关于深度学习在自然语言生成中出现幻觉问题的度量、缓解方法和未来方向，以及针对抽象摘要、对话生成、生成式问答、数据到文本生成、机器翻译和视觉语言生成的幻觉问题的任务特定研究进展。

Feb, 2022

文本生成的评估：一项调查

该文章调查了近年来开发的自然语言生成（NLG）系统的评估方法。将 NLG 评估方法分为三类，讨论了每种类别取得的进展和仍然面临的挑战，重点关注最近提出的 NLG 任务和神经 NLG 模型的评估。最后提出了自动文本摘要和长文本生成的两个任务特定的 NLG 评估示例，并提出了未来的研究方向。

Jun, 2020

数字欺骗视角下自然语言生成进展综述

本文主要探讨自然语言生成器 (NLG) 领域包括方法、评估、任务等方面的相关研究，并特别关注了 NLG 被恶意利用的潜在危险，以及存在的偏见风险。

Aug, 2022

数据驱动的自然语言生成：通向成功之路

本研究讨论了统计机器学习用于自然语言生成的商业应用的两个主要瓶颈：缺乏可靠的自动评估指标和高质量的领域内语料库。通过彻底分析当前的评估指标并提出需要新的更可靠的指标，我们解决了第一个问题。通过提出一种新的框架来开发和评估用于自然语言生成训练的高质量语料库，我们解决了第二个问题。

Jun, 2017

自动人工智能互动文本生成

本教程关注于文本生成，这是一类自然语言生成任务，它以一段文本作为输入，然后生成一篇按照某些特定标准（如可读性或语言风格）改进的修订版本，同时保留原版文本的大部分含义和长度。

Oct, 2023

自然语言生成艺术现状调查：核心任务、应用和评估

本文调查了自然语言生成的现状，包括核心任务、架构、新研究主题、评估挑战和与人工智能领域的协同作用。

Mar, 2017

E2E NLG Challenge 发现

本文介绍了第一个共享的自然语言生成（NLG）的端到端（E2E）口语对话系统实验结果。E2E NLG 共享任务旨在评估这些新方法是否能够通过从高词汇丰富度，句法复杂度和多样化的话语现象的数据集中学习来生成更高质量的输出。

Oct, 2018

迭代文本编辑的数据生成

本研究提出了一种基于迭代文本编辑的数据到文本生成新方法，使用两个先前训练模型 LaserTagger 和 GPT-2，并通过简单的启发式筛选和已训练语言模型对输出进行筛选和重新排序。

Nov, 2020