ACLMay, 2023
多语言多比喻语言检测
Multilingual Multi-Figurative Language Detection
Huiyuan Lai, Antonio Toral, Malvina Nissim
TL;DR本研究提出多语言多种修辞语言建模的方法,并在三种常见的修辞语言和七种语言中提供句子级修辞语言检测的基准,实验结果表明该框架优于几种强基线,并可作为其他相关任务的联合建模的蓝图。
Abstract
Figures of speech help people express abstract concepts and evoke stronger
emotions than literal expressions, thereby making texts more creative and
engaging. Due to its pervasive and fundamental character, figurative language
understanding has been addressed in →
figurative languagemultilingualmulti-figurative language modellingdetectionnatural language processing
发现论文,激发创造
多语言和多元文化的比喻语言理解
本文创建了适用于印地语、印尼语、爪哇语、康纳达语、巽他语、斯瓦希里语和约鲁巴语等七种不同语言的比喻推理数据集,并评估了多语言语言模型对于处理比喻语言的能力。研究发现各语言间的比喻表达依赖于文化和区域概念,并提出了需要在模型训练中暴露于更广泛的语言和文化变化中的必要性。
May, 2023
IRFL:修辞语言的图像识别
本研究提出了 “形象化语言图像识别” 数据集,探讨了视觉和语言模型理解多模态形象化语言的难点,并借助基准任务和基线模型初步研究了这一问题。结果表明,所有的模型在多模态形象化语言理解上都不如人类。该数据集和基准任务将促进模型更好地理解形象化语言。
Mar, 2023
多重形象化语言生成
提出了一种基于 BART 的 multi-figurative 语言预训练框架 mFLAG,同时提供了五种常见英文比喻形式的自动生成基准,实验结果表明该方法优于强基线,并对不同语言形式之间的关系进行了一些定性分析和思考。
Sep, 2022
ConFiguRe: 探索汉语语篇层级的修辞手法
该研究提出了 “隐喻单元” 的概念,旨在从话语层面上提取隐喻单元,并将其分类为正确的隐喻类型。在 “ConFiguRe” 上,进行了三项任务,即隐喻单元提取、隐喻类型分类和隐喻识别,并展示了现有模型在这三项任务上的不足,需要进一步研究。
Sep, 2022
预训练语言模型中的隐喻:跨数据集和语言的探测和普适性研究
该研究使用多语言数据集探索预训练语言模型中所编码的隐喻性信息,结果显示这些模型的中间层主要包含了隐喻性知识,并且该知识在多语言和多数据集中具有泛化性。
Mar, 2022
Polyglot Prompt: 多语种多任务 PromptTraining
本文旨在为多语言学习提供潜在的架构改进,通过开发一种名为 Polyglot Prompting 的学习框架,利用提示方法为不同的语言和任务学习一个统一的语义空间进行多语言多任务基于提示的学习,以实现跨语言的互助和更全面的实验评估,开创了未来多语言研究的新方向。
Apr, 2022