创意数据生成：关注文本和诗歌的综述

May, 2023

创意数据生成：关注文本和诗歌的综述

Creative Data Generation: A Review Focusing on Text and Poetry

Mohamad Elzohbi, Richard Zhao

TL;DR本文评估了创意数据生成的挑战和机遇，并重点关注了创造性写作和生成诗歌等任务。

Abstract

The rapid advancement in machine learning has led to a surge in automatic data generation, making it increasingly challenging to differentiate between naturally or human-generated data and machine-generated data. Despite these advancements, the generation of creative data remains a cha

machine learning automatic data generation creative data generation natural language generation poetry generation

发现论文，激发创造

自动诗歌生成中的多样性评估

评估自动生成诗歌的多样性，通过比较自动生成诗歌的结构、词汇、语义和风格等维度的分布与人类诗歌的分布，并考察不同模型类型和微调类型，发现当前的自动生成诗歌系统在多个维度上缺乏多样性，但风格条件和字符级建模明显增加了多样性。这些限制可用于更加多样化的未来诗歌生成模型。

Jun, 2024

文本生成：任务、评估和挑战的系统文献综述

文本生成领域的文献回顾研究了 244 篇论文，将文本生成的工作分类为五个主要任务，并分析了相关特点、子任务和具体挑战。此外，研究还评估了目前的评估方法，并确定存在的问题。研究指出了九个主要挑战，并提供了详细分析和解决方案，以及进一步研究需求。该文献回顾面向自然语言处理领域的初级研究人员和有经验的研究人员。

May, 2024

神经数据转换为文本生成的创新

本文调查了神经元数据到文本生成的方法、基准数据集和评估协议，突出了技术应用阶段及其在自然语言生成领域中的前景。

Jul, 2022

写作提示真的能创造艺术吗？

本研究探讨了基于文本提示的生成式机器学习系统，分析了语言描述的局限性、数据集的影响以及物质性和具体化等因素，最终总结了基于文本提示的系统所带来的创造性可能性，询问它们是否可以被视为一种新的艺术媒介。

Jan, 2023

数据文档生成的挑战

研究采用新颖的数据生成文本的方式，对当前的文本生成方法进行了探究，并通过提出一系列抽取性评估方法和使用当前神经生成方法得到基线结果。实验结果表明，这些模型产生流畅的文本，但未能令人信服地近似人类生成的文档，甚至模板化的基线方法在某些指标上超过了这些神经模型，尽管复制和重构扩展会导致明显的改进。

Jul, 2017

超越叙述描写：通过多方对抗训练从图像生成诗歌

本文研究以图像为输入生成多行诗歌的任务，通过提出多个深度神经网络模型，包括一个深度视觉 - 诗歌嵌入模型、一个多模式鉴别器和一个诗歌风格鉴别器，并且通过多重对抗性训练方法，实现跨模态关联和保证诗意的诗歌生成能力。实验结果表明，本论文提出的方法优于现有的诗歌生成算法。

Apr, 2018

使用工作记忆模型生成汉语诗歌

本文介绍了一种基于工作记忆模型的神经网络方法，用于自动生成中国诗歌，实验结果表明，该方法在诗歌的连贯性和表达自然性方面表现优异.

Sep, 2018

神经诗歌：使用音节生成诗歌的学习

本文探讨了基于神经语言模型和音节的诗歌生成问题，在 Dante Alighieri 的作品中进行了实验分析，结果表明生成的三行诗在句法、语法和诗歌风格上与 Dante 的真正作品相差不大。

Aug, 2019

MUGC: 机器生成与用户生成内容检测

比较了八种传统机器学习算法来区分机器生成数据和人类生成数据，结果表明传统方法在识别机器生成数据方面具有较高准确度。机器生成的文本相比人类生成的内容更短且词汇较少，而特定领域相关关键词可能导致这种高准确度，通过 word2vec 等深层次词表示可以捕捉微妙的语义差异。同时，可读性、偏见、道德和情感对比显示出机器生成内容与人类生成内容的明显差异，研究为机器生成内容在各个领域的进展能力和挑战提供了有价值的见解。

Mar, 2024

自动人工智能互动文本生成

本教程关注于文本生成，这是一类自然语言生成任务，它以一段文本作为输入，然后生成一篇按照某些特定标准（如可读性或语言风格）改进的修订版本，同时保留原版文本的大部分含义和长度。

Oct, 2023