评估 NLG 系统:简介
该文章调查了近年来开发的自然语言生成(NLG)系统的评估方法。将 NLG 评估方法分为三类,讨论了每种类别取得的进展和仍然面临的挑战,重点关注最近提出的 NLG 任务和神经 NLG 模型的评估。最后提出了自动文本摘要和长文本生成的两个任务特定的 NLG 评估示例,并提出了未来的研究方向。
Jun, 2020
自然语言生成(NLG)的评估是人工智能中一个重要但具有挑战性的问题。本文调查了基于大型语言模型的 NLG 评估方法,探讨了它们的优势和劣势,讨论了人机合作的 NLG 评估,并提出了该领域的几个开放问题和未来的研究方向。
Feb, 2024
通过对 18 位自然语言生成技术从业者的形成性半结构化访谈和 61 位从业者的调查研究,我们展示了影响自然语言生成技术评估的目标、社区实践、假设和约束,以及它们所体现的伦理考虑。
May, 2022
此文献综述聚焦于使用自然语言生成 (NLG) 自动检测和生成说服性文本的应用,旨在延伸之前研究的自动识别文本中的说服力的方面,通过将说服力的决定因素概念化为五个业务关注的类别:仁慈、语言适宜性、逻辑论证、可靠性、工具和数据集,重点关注生成方面,这些因素可以使 NLG 增加现有信息的说服力,并发展了进一步研究说服性 NLG 的研究议程,该综述分析了 77 篇文章,概述了现有的知识体系,展示了这一研究领域的稳步进展。
Jan, 2021
本研究讨论了统计机器学习用于自然语言生成的商业应用的两个主要瓶颈:缺乏可靠的自动评估指标和高质量的领域内语料库。通过彻底分析当前的评估指标并提出需要新的更可靠的指标,我们解决了第一个问题。通过提出一种新的框架来开发和评估用于自然语言生成训练的高质量语料库,我们解决了第二个问题。
Jun, 2017
自然语言生成(NLG)评估中引入大型语言模型(LLM)为评估生成内容质量提供了新的途径,本文提供了对利用 LLM 进行 NLG 评估的全面概述,包括组织现有基于 LLM 的评估指标的一致性分类法、批判性评估不同的 LLM 方法以及比较其在评估 NLG 输出中的优势和局限性,讨论未解决的挑战,并推动更公平、更先进的 NLG 评估技术。
Jan, 2024
本文探讨以知识为指导的自然语言生成技术,旨在产生具有人类思维方式的文本内容。作者提出了十个目标来指导智能化自然语言生成系统的发展,同时简要回顾了以知识和推理为指导的自然语言生成技术的成就。最后,作者展望了未来的发展方向和挑战。
Dec, 2022
该论文介绍了目前自然语言生成领域的研究现状及其衡量标准的快速发展,说明了早期的启发式量化策略难以满足各种不同类型 NLG 任务的需求,因此需要发展更加准确的自动评估指标,并给出了该领域发展的建议和方向。
Aug, 2020