利用惊喜生成双关语

ACLApr, 2019

Pun Generation with Surprise

He He, Nanyun Peng, Percy Liang

TL;DR本文提出了基于语言模型和局部 - 全局惊奇原则的双关语生成的无监督方法 —— 提取语料库中的非幽默文本进行生成，成功率较神经网络生成基线高三倍以上。

Abstract

We tackle the problem of generating a pun sentence given a pair of homophones (e.g., "died" and "dyed"). Supervised text generation is inappropriate due to the lack of a large corpus of puns, and even if such a corpus existed, mimicry is at odds with generating novel content. In this paper, we propose an unsupervised approach to →

pun generation unsupervised learning language model local-global surprisal principle retrieve-and-edit approach

发现论文，激发创造

情境下的双关语生成

本研究提出了一种上下文适应的谐音生成任务，并设计了一个基于谐音检索和生成的系统，能够通过给定的上下文关键词生成成功率为 40％的谐音，较先前的方法产生率高 32％。

Oct, 2022

基于幽默原则的双关语生成统一框架

提出了一个统一框架，用于生成同音和同形双关语以解决语言模型中的分裂问题。该框架包括三个部分：1）上下文单词 / 短语选择器，以促进双关语的歧义性、独特性和惊喜性；2）一个针对非双关语句子进行训练的生成模型，将上下文单词 / 短语纳入生成结果；3）一个标签预测器，学习了双关语的结构，用于引导推理时的生成模型。对双关语类型的评估结果表明，该模型相对于基线模型具有更好的效果。

Oct, 2022

使用歧义语境生成幽默双关语

本文提出了一种简单而有效的方法来生成双关语句子，该方法不需要训练现有双关语。我们的方法受到幽默理论的启发，即歧义来自于上下文而不是双关词本身，我们的模型首先通过反向字典生成与双关词相关概念的列表，然后利用一次性 GPT3 生成上下文单词，最后将从两个概念中的上下文词语生成双关语。人类评估表明，我们的方法成功地生成 52％的双关语，远远优于其他精心制作的基线和最先进的模型。

May, 2022

Pun-GAN: 双向对抗生成网络用于生成双关语

本文介绍了一种无需预先收集大量双关语语料库的生成双关语句子的方法 ——Pun-GAN，该方法采用对抗生成网络和强化学习，并在自动和人类评估中取得了更大的歧义性和多样性效果。

Oct, 2019

英文双关语的联合检测和定位

该论文从序列标注的角度，提出了一种同时解决双关语检测和位置定位的方法，并采用新的标记方案，表明该方法在处理同形异义词和同音异义词方面都具有显著的效果，实验结果证明了该方法可以达到最新的最优结果。

Aug, 2019

ExPUNations: 使用关键词和解释增强押韵效果

本文提出了一个用于理解和生成语言幽默的数据集 ExPUN，其中包含有关标记单词的详细注释，用于描述开玩笑的原因的双关语解释以及细粒度的幽默等级评分。同时，本文提出了解释生成和关键字条件的双关语生成两个任务，以挑战目前自然语言理解和生成模型的理解和生成幽默的能力，并展示了我们收集的注释关键字有助于生成更好的新颖幽默文本。

Oct, 2022

The Boating Store Had Its Best Sail Ever”: 重读音敏感的情境化双关语识别

本文提出了 Pronunciation-attentive Contextualized Pun Recognition（PCPR）模型，该模型通过捕捉相关语境与其对应音标符号之间的关联性来感知人类幽默，检测句子中是否包含双关语并定位它们。实验表明，该方法在双关语检测和定位任务中明显优于现有方法，并经过了深入分析验证了 PCPR 的有效性和鲁棒性。

Apr, 2020

不确定性和惊讶力量结合：利用基于不一致特征进行幽默识别

通过研究幽默机制，将笑话分成两个部分：设定和妙语。由于底层模型的不断升级，我们能够将设置和妙语一起馈入 GPT-2 语言模型，并计算笑话的不确定性和惊喜度。实验结果表明，这两个特征具有更好的识别非笑话和笑话的能力。

Dec, 2020

认真对待幽默：使用无趣的大型语言模型构建幽默数据集

通过编辑文本，我们研究了大型语言模型（LLMs）是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试，并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中，能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集，发现 GPT-4 的合成数据得到了双语注释者的高评价，并为幽默分类器提供了具有挑战性的对抗性例子。

Feb, 2024

双关谜实现模型

本文介绍了一个用于生成问答式双关语的简单问题 - 答案双关语模型 JAPE。该模型使用了结构图谱和模板，能够成功生成识别为笑话的段落，但有些并不是很好的笑话。我们提出了一些潜在的改进和扩展，包括后期启发式方法以根据质量排序笑话。

Jun, 1994