基于特征和神经网络扫描诗歌的比较
本文提供了英语和德语的大型诗歌语料库,并注释了较小语料库中的韵律特征以训练神经模型,以实现鲁棒性大规模分析。我们表明,具有音节嵌入的双向 LSTM-CRF 模型胜过 CRF 基线和不同的 BERT-based 方法。在多任务设置中,特定有益的任务关系说明了诗歌特征的相互依赖。
Feb, 2021
通过深度学习,我们在大量语音记录的数据库上训练了一个中型递归神经网络,用于语言识别任务。网络能够在 40% 的情况下正确识别出 10 秒的语音记录的语言,并且在三分之二的情况下将语言排在前三名。可视化方法显示,从网络激活中构建的表示与语音节奏的分类系统一致,尽管得到的映射比重音节和音节定时语言之间的两个分离簇更复杂。通过识别网络激活与已知语音节奏度量之间的相关性,我们进一步分析了模型。这些发现展示了深度学习工具通过识别和探索与语言相关的声学特征空间,推动我们对语音节奏的认识的潜力。
Jan, 2024
本文提出了一种联合架构,用于捕捉十四行诗的语言、韵律和节奏。我们使用众包和专家评估生成的诗歌的质量。研究表明专家评估对诗歌生成的重要性,并且未来的研究应该超越韵律、节奏,注重诗意语言。
Jul, 2018
本文探讨了基于神经语言模型和音节的诗歌生成问题,在 Dante Alighieri 的作品中进行了实验分析,结果表明生成的三行诗在句法、语法和诗歌风格上与 Dante 的真正作品相差不大。
Aug, 2019
通过评估大型语言模型对诗歌的识别能力,探讨大型语言模型在评估模型、数字人文和文化分析领域的挑战和困境,以及用于预训练数据集的诗歌的审查和反思。
Jun, 2024
本文提出了一个新的层次框架,用于生成十四行诗,不需要训练。该框架包括内容规划模块、韵脚模块和润色模块,并设计了受约束的解码算法以实现生成的十四行诗的韵律和韵脚约束。自动和人工评估表明,该框架比几个强基线更具连贯性、诗意和创造性。
May, 2022
通过本文介绍的一种基于本地序列对齐的无监督方法,将诗歌文本编码为一系列韵律特征的字符串,从而检测诗歌中的结构相似性,以便进行跨语言和历史研究。
Apr, 2024
本文比较了各种文本生成模型在写作早期英国浪漫主义诗歌方面的能力,通过系统测试和 GRUEN 评估指标,发现变压器模型的质量明显优于递归神经网络模型,并随着参数大小的增加而进一步提高。
Jun, 2022
本文探讨了使用诊断分类器和表征相似性分析两种分析技术来衡量神经网络模型中语音学的表现,并研究了两个因素对分析结果的影响,最终得出全局范围方法往往提供更一致的结果且应作为本地范围方法的补充。
Apr, 2020