英文双关语的联合检测和定位
提出了一个统一框架,用于生成同音和同形双关语以解决语言模型中的分裂问题。该框架包括三个部分:1)上下文单词 / 短语选择器,以促进双关语的歧义性、独特性和惊喜性;2)一个针对非双关语句子进行训练的生成模型,将上下文单词 / 短语纳入生成结果;3)一个标签预测器,学习了双关语的结构,用于引导推理时的生成模型。对双关语类型的评估结果表明,该模型相对于基线模型具有更好的效果。
Oct, 2022
本研究提出了一种上下文适应的谐音生成任务,并设计了一个基于谐音检索和生成的系统,能够通过给定的上下文关键词生成成功率为 40%的谐音,较先前的方法产生率高 32%。
Oct, 2022
本文提出了一种简单而有效的方法来生成双关语句子,该方法不需要训练现有双关语。我们的方法受到幽默理论的启发,即歧义来自于上下文而不是双关词本身,我们的模型首先通过反向字典生成与双关词相关概念的列表,然后利用一次性 GPT3 生成上下文单词,最后将从两个概念中的上下文词语生成双关语。人类评估表明,我们的方法成功地生成 52%的双关语,远远优于其他精心制作的基线和最先进的模型。
May, 2022
本文提出了 Pronunciation-attentive Contextualized Pun Recognition(PCPR)模型,该模型通过捕捉相关语境与其对应音标符号之间的关联性来感知人类幽默,检测句子中是否包含双关语并定位它们。实验表明,该方法在双关语检测和定位任务中明显优于现有方法,并经过了深入分析验证了 PCPR 的有效性和鲁棒性。
Apr, 2020
本文提出了一个用于理解和生成语言幽默的数据集 ExPUN,其中包含有关标记单词的详细注释,用于描述开玩笑的原因的双关语解释以及细粒度的幽默等级评分。同时,本文提出了解释生成和关键字条件的双关语生成两个任务,以挑战目前自然语言理解和生成模型的理解和生成幽默的能力,并展示了我们收集的注释关键字有助于生成更好的新颖幽默文本。
Oct, 2022
本文介绍了一种无需预先收集大量双关语语料库的生成双关语句子的方法 ——Pun-GAN,该方法采用对抗生成网络和强化学习,并在自动和人类评估中取得了更大的歧义性和多样性效果。
Oct, 2019
本文介绍了一个用于生成问答式双关语的简单问题 - 答案双关语模型 JAPE。该模型使用了结构图谱和模板,能够成功生成识别为笑话的段落,但有些并不是很好的笑话。我们提出了一些潜在的改进和扩展,包括后期启发式方法以根据质量排序笑话。
Jun, 1994
该论文介绍了参加 SemEval-2017 任务 7:检测和解释英语双关语的 Duluth 系统,其中使用了词义消歧和语义相关性的方法。
Apr, 2017
本文介绍了构建能够为特定图像生成俏皮描述的计算机模型的研究,并且根据人类对幽默的欣赏理解,采用语言文字游戏,特别是双关语来为图像添加俏皮描述,并使用大量语料库或编码 - 解码神经网络结构产生,与有意义的基准方法通过人类研究进行了比较,证明了实现幽默的模型表现得更好。
Apr, 2017