本研究提出多语言多种修辞语言建模的方法,并在三种常见的修辞语言和七种语言中提供句子级修辞语言检测的基准,实验结果表明该框架优于几种强基线,并可作为其他相关任务的联合建模的蓝图。
May, 2023
本研究提出了 “形象化语言图像识别” 数据集,探讨了视觉和语言模型理解多模态形象化语言的难点,并借助基准任务和基线模型初步研究了这一问题。结果表明,所有的模型在多模态形象化语言理解上都不如人类。该数据集和基准任务将促进模型更好地理解形象化语言。
Mar, 2023
基于多任务比喻语言模型的研究在文本中检测多种比喻语言特征,并且集成到作者归属任务中以提高性能。
Jun, 2024
本研究探讨了语言模型在理解比喻和比喻性语言方面的能力,并提出了新的语言理解任务,发现现有语言模型在理解非字面短语方面的表现还有待于进一步提升。
Apr, 2022
通过使用隐喻语言模型掩盖字面意思从而生成比喻性的解释,且该方法不仅关注动词,还包括名词和形容词。 这种方法在元数据的分类中实现了比人工方法更高的水平。
Oct, 2022
本文创建了适用于印地语、印尼语、爪哇语、康纳达语、巽他语、斯瓦希里语和约鲁巴语等七种不同语言的比喻推理数据集,并评估了多语言语言模型对于处理比喻语言的能力。研究发现各语言间的比喻表达依赖于文化和区域概念,并提出了需要在模型训练中暴露于更广泛的语言和文化变化中的必要性。
本文描述了隐喻释义生成的任务,并提出了两种不同的模型:词汇替换基线和一种新的序列 - 序列模型 “隐喻屏蔽”,它可以生成自由的隐喻释义。我们使用众包来评估我们的结果,并开发了自动度量衡来评估隐喻释义。我们发现,虽然词汇替换基线能够产生准确的释义,但它们往往缺乏隐喻,而我们的隐喻屏蔽模型在生成隐喻句子方面表现出色,同时在流利度和释义质量方面表现也很好。
Feb, 2020
本文研究了两种非组合式比喻语言 (成语和比喻) 的解释,并提出了基于人类策略的知识增强模型,从而改善了区分和生成任务的表现,进一步缩小了与人类表现的差距。
Aug, 2021
研究发现现有的对话模型在处理比喻和比拟等修辞语言时存在很大的不足,提出利用外部资源将比喻语言转化为字面意思以提高模型鲁棒性的解决方案。
Oct, 2021
通过使用并行语料库以及基于序列到序列模型和隐马尔可夫模型的方法,本文构建了一个自动跨领域语义映射的框架,通过生成一些具有语义相似性的例子,实现了提取图形用户界面元素的语义。
Mar, 2021