创意数据生成:关注文本和诗歌的综述
评估自动生成诗歌的多样性,通过比较自动生成诗歌的结构、词汇、语义和风格等维度的分布与人类诗歌的分布,并考察不同模型类型和微调类型,发现当前的自动生成诗歌系统在多个维度上缺乏多样性,但风格条件和字符级建模明显增加了多样性。这些限制可用于更加多样化的未来诗歌生成模型。
Jun, 2024
文本生成领域的文献回顾研究了 244 篇论文,将文本生成的工作分类为五个主要任务,并分析了相关特点、子任务和具体挑战。此外,研究还评估了目前的评估方法,并确定存在的问题。研究指出了九个主要挑战,并提供了详细分析和解决方案,以及进一步研究需求。该文献回顾面向自然语言处理领域的初级研究人员和有经验的研究人员。
May, 2024
本研究探讨了基于文本提示的生成式机器学习系统,分析了语言描述的局限性、数据集的影响以及物质性和具体化等因素,最终总结了基于文本提示的系统所带来的创造性可能性,询问它们是否可以被视为一种新的艺术媒介。
Jan, 2023
研究采用新颖的数据生成文本的方式,对当前的文本生成方法进行了探究,并通过提出一系列抽取性评估方法和使用当前神经生成方法得到基线结果。实验结果表明,这些模型产生流畅的文本,但未能令人信服地近似人类生成的文档,甚至模板化的基线方法在某些指标上超过了这些神经模型,尽管复制和重构扩展会导致明显的改进。
Jul, 2017
本文研究以图像为输入生成多行诗歌的任务,通过提出多个深度神经网络模型,包括一个深度视觉 - 诗歌嵌入模型、一个多模式鉴别器和一个诗歌风格鉴别器,并且通过多重对抗性训练方法,实现跨模态关联和保证诗意的诗歌生成能力。实验结果表明,本论文提出的方法优于现有的诗歌生成算法。
Apr, 2018
本文探讨了基于神经语言模型和音节的诗歌生成问题,在 Dante Alighieri 的作品中进行了实验分析,结果表明生成的三行诗在句法、语法和诗歌风格上与 Dante 的真正作品相差不大。
Aug, 2019
比较了八种传统机器学习算法来区分机器生成数据和人类生成数据,结果表明传统方法在识别机器生成数据方面具有较高准确度。机器生成的文本相比人类生成的内容更短且词汇较少,而特定领域相关关键词可能导致这种高准确度,通过 word2vec 等深层次词表示可以捕捉微妙的语义差异。同时,可读性、偏见、道德和情感对比显示出机器生成内容与人类生成内容的明显差异,研究为机器生成内容在各个领域的进展能力和挑战提供了有价值的见解。
Mar, 2024
本教程关注于文本生成,这是一类自然语言生成任务,它以一段文本作为输入,然后生成一篇按照某些特定标准(如可读性或语言风格)改进的修订版本,同时保留原版文本的大部分含义和长度。
Oct, 2023