- 大型模型和数据集的诗歌评估:十四行诗还是机器人?
通过评估大型语言模型对诗歌的识别能力,探讨大型语言模型在评估模型、数字人文和文化分析领域的挑战和困境,以及用于预训练数据集的诗歌的审查和反思。
- 让诗歌击中节奏:使用基于字节的 Transformer 进行节拍对齐的诗歌生成
通过字节为基础的语言模型,本研究探索了诗歌和音乐的交叉点,着重研究了节奏模式,以创造与诗歌上下文中的特定节奏模式相匹配的词语。结果表明,在保持语义连贯性的同时,节奏高度对齐。未来的工作将旨在提高该模型创作完整的节奏对齐诗歌的能力。
- 递归证明定理
POETRY 使用逐级递归的方式在 Isabelle 定理证明机中证明定理,通过在每一级搜索可验证的证明草图并专注于解决当前级别的定理或猜想,从而解决了自动定理证明中的挑战。
- 编码 - 解码框架实现可控高质量韵律的交互式自由体诗生成
生成诗歌或歌词涉及到几个创作因素,而其中一个具有挑战性的方面是对较严格的韵律和押韵模式的遵循。为了解决这一挑战,之前的工作主要集中在逆向语言建模上,我们提出了一种新的微调方法,通过将押韵的词语放在每个歌词的开头,使关键的押韵决策可以在模型承 - ACL早期中世纪希伯来诗歌隐喻检测数据集
这篇论文介绍了一个新的、具有专家注释的后古代和中世纪希伯来诗歌数据集,探讨了其中的隐喻现象,并希望能够促进这一领域的进一步研究。
- AI 是否能像人类一样写古代汉诗?基于图灵测试的实证研究
本文通过研究一项重要问题,提出了 ProFTAP 评估框架,将其应用于目前的大型语言模型(LLMs)并发现最新的 LLMs 确实具备了与人类几乎无法区分的写作古典汉诗的能力,同时揭示多个开源 LLMs 能够胜过 GPT-4 在这一任务上。
- Erato: 自动化诗歌评估
我们介绍了 Erato,这是一个旨在促进诗歌的自动评估的框架,包括由诗歌生成系统生成的诗歌。我们的框架采用了多种特征,并简要概述了 Erato 的功能和扩展潜力。使用 Erato,我们将人类创作的诗歌与自动生成的诗歌进行对比,展示了它在识别 - ALBERTI,一种用于诗歌分析的多语种领域特定语言模型
本文介绍了一个多种语言诗歌首款多语言预训练大型语言模型 ALBERTI,通过专门领域预训练,对来自 12 种语言的 1200 万诗句语料库进行训练,表现出色,达到了德语的最新水平
- PoeticTTS -- 用于文学研究的可控诗歌朗读
本研究提出了一种方法,对诗歌进行语音合成,从而使文学学者可以系统地研究文本、口语实现和听众对诗歌的感知之间的相互影响,并发现该方法在客观评估和人类研究中取得了成功。
- 浪漫计算
本文比较了各种文本生成模型在写作早期英国浪漫主义诗歌方面的能力,通过系统测试和 GRUEN 评估指标,发现变压器模型的质量明显优于递归神经网络模型,并随着参数大小的增加而进一步提高。
- ACL逐句配对增强诗歌创作
本文介绍了我们使用人工智能增强写诗创作过程的实验 ——Verse by Verse。我们创建了一组样式各不相同的 AI 诗人,能够在用户创作诗歌时提供一些生成的诗句作为建议。文章描述了提供这些建议的基础系统,包括离线生成模型和双编码器模型。
- ACL野外韵律标记:用韵律特征建立和注释诗歌语料库
本文提供了英语和德语的大型诗歌语料库,并注释了较小语料库中的韵律特征以训练神经模型,以实现鲁棒性大规模分析。我们表明,具有音节嵌入的双向 LSTM-CRF 模型胜过 CRF 基线和不同的 BERT-based 方法。在多任务设置中,特定有益 - NIPS结合学习的歌词结构和词汇以提高歌词生成
本文提出一种机制,将两个分别训练的语言模型结合起来,旨在生成符合期望歌曲结构的输出,同时提供丰富的词汇量,从而提高其创造力。
- IJCAI使用工作记忆模型生成汉语诗歌
本文介绍了一种基于工作记忆模型的神经网络方法,用于自动生成中国诗歌,实验结果表明,该方法在诗歌的连贯性和表达自然性方面表现优异.
- COLING应用中国历代人物传记数据库追踪唐宋诗词中的用词
通过大规模比较唐宋诗歌,揭示诗人之间如何使用和分享词汇、搭配和表达方式,研究唐宋诗歌中词汇的使用情况及背后的语言学现象、社会情境变化,为词典学、语义学和社会转型提供参考。