大型语言模型是优良的多语言学习者：当LLMs遇上跨语言提示

Sep, 2024

大型语言模型是优良的多语言学习者：当LLMs遇上跨语言提示

Large Language Models are Good Multi-lingual Learners : When LLMs Meet Cross-lingual Prompts

Teng Wang, Zhenqi He, Wing-Yin Yu, Xiaojin Fu, Xiongwei Han

TL;DR本研究解决了大型语言模型在处理复杂和长上下文中的规则遵循不足的问题。提出了一种新型的多语言提示策略MLPrompt，它通过将模型难以遵循的规则翻译成另一种语言来增强模型的注意力。实验证明，MLPrompt在多个任务上超越了现有的最先进提示方法，具有重要的应用潜力。

Abstract

With the advent of Large Language Models (LLMs), generating rule-based data for real-world applications has become more accessible. Due to the inherent ambiguity of natural language and the complexity of rule sets, especially in long contexts, LLMs often struggle to follow all specifie

发现论文，激发创造

LLMs 中并非所有语言的质量相同: 通过跨语言思维提示提高多语言能力

本研究提出了一种名为跨语言思维提示（XLT）的方法，通过激发跨语言和逻辑推理技能，改善了大语言模型的多语言能力，并在与推理、理解和生成有关的7个基准测试中进行了全面的评估，实验结果显示XLT不仅显著提高了各种多语种任务的性能，而且还显著减少了不同语言中每个任务平均性能和最佳性能之间的差距。

May, 2023

多语言大型语言模型还不能切换语言

本文通过大量实证研究探索了多语言大型语言模型在涉及语种切换的情况下情感分析、机器翻译和单词级别语言识别等任务的表现。研究显示，虽然这些模型在使用零 / 少量提示时在某些任务中表现出色，但与较小的微调模型相比，它们的性能仍然有所不适。因此，研究者认为未来需要进一步研究来完全弥合这一差距。

May, 2023

关于使用大型语言模型进行双语词典归纳

使用最新一代的大型语言模型，我们系统地研究了双语词典诱导（BLI）任务，包括无监督的零样本诱导、少样本上下文诱导和标准的BLI模型微调，并证明了与当前BLI方法相比，这种方法在许多语言对上取得了最新的BLI成绩。

Oct, 2023

自回归大型语言模型中的提示

自回归大语言模型已经改变了自然语言处理领域的格局。基于预训练和提示范式的方法已经取代了常规的预训练和微调方法用于许多下游自然语言处理任务。本文讨论了已经在自回归大语言模型上使用的各种提示技术，提供了一个基于这个分类体系的简明调研，并且确定了自回归大语言模型中提示领域的一些未解决问题，可作为未来研究的方向。

Nov, 2023

分解促使：揭示英语为中心的大型语言模型中的多语言语言结构知识

该研究介绍了分解提示方法，用于探究英语为中心的大型语言模型在序列标注任务中对语言结构的理解能力，其研究结果表明分解提示优于迭代提示基线，在零样本和少样本情况下具备更高的效用和效率，并发现评估方法和提示中的指令使用对结果有影响，同时发现英语为中心的语言模型在多语言任务中表现优于多语言模型，从而对英语为中心的语言模型的多语言可迁移性进行了深入研究，为了解其多语言语言知识做出了贡献。

Feb, 2024

大型语言模型的高效提示方法综述

在这篇论文中，我们对高效提示的各种方法进行了全面的概述，包括使用高效计算和高效设计进行提示的方法，重点关注未来的研究方向。

Apr, 2024

大型语言模型的国际化综述：最新进展和新的研究方向

对大型语言模型（LLMs）在多语种环境中的应用进行了综述，包括训练和推理方法、模型安全性、多领域与语言文化、数据集使用，同时讨论了相关方面的主要挑战和潜在解决方案，并提出了进一步增强语言模型的未来研究方向。

May, 2024

超越英语的LLMs：通过跨语言反馈扩展LLMs的多语言能力

通过构建两个数据集，将 LLaMA 和 BLOOM 的多语言能力扩展到 100 种语言，并使用 DPO 算法对 LLMs 进行与人类反馈的对齐，实现了对 100 种语言的支持，从而定义了最新的、支持 100 种语言的多语言 LLMs 的最新技术。

Jun, 2024

理解和缓解LLMs中的语言混淆

LLMs have limitations in generating text in a user's desired language, and the Language Confusion Benchmark evaluates these failures, finding that Llama Instruct and Mistral models exhibit high degrees of language confusion, even the strongest models fail to consistently respond in the correct language.

Jun, 2024

代码混合：测量多语言大型语言模型的能力的新方法

本研究针对多语言大型语言模型在代码混合（即在一次发言中混合多种语言）的机器翻译能力不足的现状，提出了一种新的规则基础提示技术。研究发现，尽管通过k-shot提示（$k\in\{0, 1, 10, 20\}$）通常能取得最佳效果，但规则基础提示在生成独特的代码混合句子方面展现出潜力，并创建了涵盖五种语言对的黄金标准代码混合数据集。

Oct, 2024