评估 NLG 系统：简介

Mar, 2023

Evaluating NLG systems: A brief introduction

Emiel van Miltenburg

TL;DR该论文简要介绍了自然语言生成领域中的评估，解释了关键术语和区别，并提出了一个奖项，以激励研究人员更多地关注他们系统输出的评估方法。

Abstract

This year the International Conference on natural language generation (INLG) will feature an award for the paper with the best evaluation. The purpose of this award is to provide an incentive for NLG

natural language generation evaluation researchers output systems

发现论文，激发创造

文本生成的评估：一项调查

该文章调查了近年来开发的自然语言生成（NLG）系统的评估方法。将 NLG 评估方法分为三类，讨论了每种类别取得的进展和仍然面临的挑战，重点关注最近提出的 NLG 任务和神经 NLG 模型的评估。最后提出了自动文本摘要和长文本生成的两个任务特定的 NLG 评估示例，并提出了未来的研究方向。

Jun, 2020

基于 LLM 的自然语言生成评估：现状与挑战

自然语言生成（NLG）的评估是人工智能中一个重要但具有挑战性的问题。本文调查了基于大型语言模型的 NLG 评估方法，探讨了它们的优势和劣势，讨论了人机合作的 NLG 评估，并提出了该领域的几个开放问题和未来的研究方向。

Feb, 2024

构建自然语言生成系统

研究人工智能自然语言生成系统 (NLG)，探讨其任务与应用，介绍 NLG 领域基本知识给潜在的合作伙伴。

May, 1996

拆解自然语言生成评估：评估实践、假设及其影响

通过对 18 位自然语言生成技术从业者的形成性半结构化访谈和 61 位从业者的调查研究，我们展示了影响自然语言生成技术评估的目标、社区实践、假设和约束，以及它们所体现的伦理考虑。

May, 2022

自然语言生成艺术现状调查：核心任务、应用和评估

本文调查了自然语言生成的现状，包括核心任务、架构、新研究主题、评估挑战和与人工智能领域的协同作用。

Mar, 2017

有说服力的自然语言生成 -- 文献综述

此文献综述聚焦于使用自然语言生成 (NLG) 自动检测和生成说服性文本的应用，旨在延伸之前研究的自动识别文本中的说服力的方面，通过将说服力的决定因素概念化为五个业务关注的类别：仁慈、语言适宜性、逻辑论证、可靠性、工具和数据集，重点关注生成方面，这些因素可以使 NLG 增加现有信息的说服力，并发展了进一步研究说服性 NLG 的研究议程，该综述分析了 77 篇文章，概述了现有的知识体系，展示了这一研究领域的稳步进展。

Jan, 2021

数据驱动的自然语言生成：通向成功之路

本研究讨论了统计机器学习用于自然语言生成的商业应用的两个主要瓶颈：缺乏可靠的自动评估指标和高质量的领域内语料库。通过彻底分析当前的评估指标并提出需要新的更可靠的指标，我们解决了第一个问题。通过提出一种新的框架来开发和评估用于自然语言生成训练的高质量语料库，我们解决了第二个问题。

Jun, 2017

利用大型语言模型进行自然语言生成评估：综述

自然语言生成（NLG）评估中引入大型语言模型（LLM）为评估生成内容质量提供了新的途径，本文提供了对利用 LLM 进行 NLG 评估的全面概述，包括组织现有基于 LLM 的评估指标的一致性分类法、批判性评估不同的 LLM 方法以及比较其在评估 NLG 输出中的优势和局限性，讨论未解决的挑战，并推动更公平、更先进的 NLG 评估技术。

Jan, 2024

运用知识和推理实现类人自然语言生成：简要回顾

本文探讨以知识为指导的自然语言生成技术，旨在产生具有人类思维方式的文本内容。作者提出了十个目标来指导智能化自然语言生成系统的发展，同时简要回顾了以知识和推理为指导的自然语言生成技术的成就。最后，作者展望了未来的发展方向和挑战。

Dec, 2022

自然语言生成系统所使用的评价指标调查

该论文介绍了目前自然语言生成领域的研究现状及其衡量标准的快速发展，说明了早期的启发式量化策略难以满足各种不同类型 NLG 任务的需求，因此需要发展更加准确的自动评估指标，并给出了该领域发展的建议和方向。

Aug, 2020