对话大型语言模型中的成语检测：一道难题

May, 2024

对话大型语言模型中的成语检测：一道难题

A Hard Nut to Crack: Idiom Detection with Conversational Large Language Models

Francesca De Luca Fornaciari, Begoña Altuna, Itziar Gonzalez-Dios, Maite Melero

TL;DR本研究探讨了大型语言模型 (LLMs) 在习语语言处理方面的应用。我们介绍了由语言专家设计的新的难题数据集 “IdioTS”，用于评估 LLMs 在句子级别处理比喻语言的能力。我们提出了一种基于习语检测任务的综合评估方法，其中 LLMs 被提示在给定的英文句子中检测习语表达。我们对结果进行了全面的自动和手动评估，并进行了广泛的错误分析。

Abstract

In this work, we explore idiomatic language processing with Large Language Models (LLMs). We introduce the Idiomatic language Test Suite idiots, a new dataset of difficult examples specifically designed by langua

idiomatic language processing large language models idiots idiom detection task figurative language

发现论文，激发创造

时代之符号：评估大型语言模型在成语辨析中的应用

大型语言模型和仅编码器模型在处理可能包含习语的任务时的表现如何以及与之相比的性能状况被探究，结果显示尽管大型语言模型在不同尺度下都具有竞争力的性能，但其结果并不及细调为特定任务的模型，我们还发现模型规模的增加能够显著提高性能，并讨论了利用大型语言模型来解决这些任务的可行性。

May, 2024

提升成语翻译的 LLM 能力

通过改进大型语言模型对惯用语的处理，我们旨在提高翻译的准确性，同时保留原有的语言风格，以确保翻译文本保持意图和情感共鸣，促进跨文化交流。具有显著的社会影响力。通过扩展现有的知识库，我们使用两种方法进行翻译：第一种方法使用 SentenceTransformers 模型，在原语言和目标语言习语的含义之间生成余弦相似度分数，选择最佳习语；第二种方法利用大型语言模型，在目标语言中找到对应的习语进行翻译。通过英汉、汉英的人工评估，余弦相似度查找方法在所有 GPT4o 翻译中均表现优于其他方法。此外，我们还通过开发一种低资源的乌尔都数据集，包含乌尔都语的习语及其翻译，进一步扩充了知识库，展示了余弦相似度查找方法在消除语言障碍、探索中文和乌尔都的多样文学作品方面的潜力。

Jul, 2024

会话系统中成语的向量表征

本文研究表明，由习语或比喻语言训练的开放域对话系统能够更好地生成与包含习语提示相符的回复，通过利用潜在习惯表达（PIE）- 英语习语语料库，我们实现了 98％F1 宏分数的准确率和更好的会话回复效果，为公众贡献了模型检查点 / 演示和代码。

May, 2022

HiJoNLP 参加 SemEval-2022 任务 2: 使用多语言预训练语言模型检测多词表达的成语性

使用多语言预训练语言模型的上下文表示仅探测习语性的方法，实验发现模型规模越大在习语性探测上越有效。然而，使用较高的模型层不一定能够保证更好的性能。在多语言场景下，不同语言的融合不一致，资源丰富的语言比其他语言更具有优势。

May, 2022

审视冰山一角：一组惯用语翻译的数据集

本文提出了第一个大规模的短语翻译数据集，用于解决神经机器翻译模型中的成语翻译问题，并通过初步的实验评估了该数据集的效果。

Feb, 2018

由大胆解决问题到破解难题：成语文本生成

本篇文章研究了一种新的文本生成应用 —— 成语句子生成，通过使用神经模型和心理语言学理论，该文章提出一种有效转化直接字面短语到相应成语短语的方法，该方法在新建数据集上表现突出，超过其他文本生成竞争基准模型。

Apr, 2021

HIT 在 SemEval-2022 任务 2 中的表现：预训练语言模型用于成语检测

通过使用预训练的语言模型，我们可以提供上下文感知的句子嵌入来检测句子中的多词表达是否是惯用用法，从而更好地理解多词表达的惯用含义。

Apr, 2022

使用语义兼容性进行惯用语表达式识别

本研究提出了一种多阶段深度神经网络架构，利用注意力机制和上下文信息对句子中的习语表达进行定位，通过评估表明该模型能够在各类习语表达的数据集上实现新的最优结果，并具有对未见过的习语表达的识别能力。

Oct, 2021

翻译意义而非单纯的词语：IdiomKB 在通过语言模型优化成语翻译中的作用

使用大型语言模型开发的多语言习语知识库（IdiomKB）能够提高机器翻译模型的性能，通过检索习语的比喻含义，使较小的模型在翻译过程中得到更全面的理解。

Aug, 2023

预训练语言模型中习语的探索数据集和方法

本文介绍了一个包含英语和葡萄牙语的细粒度含义数据集，用于测试语言模型对习语使用的检测能力和生成含有习语句子的表现效果，并且发现 fine-tuning 是学习包含 MWE 的句子表示的一种有效的样本高效方法。

Sep, 2021