提升成语翻译的LLM能力

Jul, 2024

Improving LLM Abilities in Idiomatic Translation

Sundesh Donthi, Maximilian Spencer, Om Patel, Joon Doh, Eid Rodan

TL;DR通过改进大型语言模型对惯用语的处理，我们旨在提高翻译的准确性，同时保留原有的语言风格，以确保翻译文本保持意图和情感共鸣，促进跨文化交流。具有显著的社会影响力。通过扩展现有的知识库，我们使用两种方法进行翻译：第一种方法使用SentenceTransformers模型，在原语言和目标语言习语的含义之间生成余弦相似度分数，选择最佳习语；第二种方法利用大型语言模型，在目标语言中找到对应的习语进行翻译。通过英汉、汉英的人工评估，余弦相似度查找方法在所有GPT4o翻译中均表现优于其他方法。此外，我们还通过开发一种低资源的乌尔都数据集，包含乌尔都语的习语及其翻译，进一步扩充了知识库，展示了余弦相似度查找方法在消除语言障碍、探索中文和乌尔都的多样文学作品方面的潜力。

Abstract

For large language models (LLMs) like NLLB and GPT, translating idioms remains a challenge. Our goal is to enhance translation fidelity by improving LLM processing of →

发现论文，激发创造

利用黑名单方法评估中文成语机器翻译性能

本文基于黑名单方法，使用一个新的评估方法 CIBB 测试数据集，对机器翻译系统的成语翻译质量进行了评估，结果表明常见错误类型为逐字逐句字面翻译，黑名单方法可以有效发现该种错误类型。

Nov, 2017

审视冰山一角：一组惯用语翻译的数据集

本文提出了第一个大规模的短语翻译数据集，用于解决神经机器翻译模型中的成语翻译问题，并通过初步的实验评估了该数据集的效果。

Feb, 2018

神经机器翻译中成语的自动评估和分析

本文探讨了神经机器翻译中存在的习语翻译难题，提出了一个新的自动化量化习语翻译错误的方法，并通过对模型的训练以及不同翻译测试集的测试，探索了单语预训练和习语上下文因素对翻译质量的影响。

Oct, 2022

大语言模型的多语言机器翻译：实证结果和分析

本文系统地研究了大型语言模型在多语言机器翻译中的优势和挑战，并在 102 种语言上评估了 XGLM、OPT、BLOOMZ 和 ChatGPT 四种常见模型的性能。在进一步分析中，本文发现大型语言模型在多语言机器翻译中具有一些新的工作方式。

Apr, 2023

翻译意义而非单纯的词语：IdiomKB在通过语言模型优化成语翻译中的作用

使用大型语言模型开发的多语言习语知识库（IdiomKB）能够提高机器翻译模型的性能，通过检索习语的比喻含义，使较小的模型在翻译过程中得到更全面的理解。

Aug, 2023

跨越门槛：通过检索增强和损失加权的习语机器翻译

机器翻译的一个挑战是正确翻译习语表达，本研究提供了对习语翻译及相关问题的简单描述，并通过实验找到了适合使用习语翻译的临界点。为了丰富多语种资源，我们编制了一个包含法语、芬兰语和日语中约4千个自然句子的数据集，同时引入了两种简单而有效的技术来改进自然习语的翻译，这不仅在习语句子的准确性上提高了强大预训练机器翻译模型达到了13%的绝对准确度，而且也对非习语句子存在潜在的好处。

Oct, 2023

跨语言词汇适应的实证研究：高效生成式LLM推理

对五种生成式大型语言模型进行了实证研究，探讨了跨语言词汇适应方法对提高模型推理效率的有效性，发现跨语言词汇适应可大幅提升模型推理速度高达271.5%，同时适应更平衡的多语种数据可以使下游性能接近原始模型。

Feb, 2024

对话大型语言模型中的成语检测：一道难题

本研究探讨了大型语言模型 (LLMs) 在习语语言处理方面的应用。我们介绍了由语言专家设计的新的难题数据集“IdioTS”，用于评估LLMs在句子级别处理比喻语言的能力。我们提出了一种基于习语检测任务的综合评估方法，其中LLMs被提示在给定的英文句子中检测习语表达。我们对结果进行了全面的自动和手动评估，并进行了广泛的错误分析。

May, 2024

跨文化翻译: 针对语内文化适应的法学硕士

该研究定义了文化适应的任务，并创建了一个评估框架来评估不同模型在这个任务上的性能。研究评估了现代LLMs在文化适应方面的表现，分析了它们在不同文化之间连接相关概念时的跨文化知识，并分析了自动适应中可能存在的文化偏见和刻板印象。希望该任务能够更深入地了解LLMs在跨文化情境中的文化理解和创造力。

Jun, 2024

基于GPT-4的创意和语境感知的东亚成语翻译

本研究解决了东亚成语翻译中人类翻译者面临的挑战，尤其是在语境感知翻译方面。通过评估GPT-4生成高质量翻译的能力，研究发现其在创造性和准确性上优于传统翻译引擎，并显著提高了每个成语的高质量翻译数量，具有广泛的应用潜力。此外，所有代码和数据都已开源，以推动进一步的研究。

Oct, 2024