利用自然语言提示进行机器翻译

Feb, 2022

Using natural language prompts for machine translation

Xavier Garcia, Orhan Firat

TL;DR本文旨在探讨自然语言提示在控制机器翻译模型输出方面的应用，并证明其能够影响输出的正式程度和具体方言等属性。研究还表明，使用语言名称控制多语言翻译模型的输出语言能够使得未见过的语言对之间产生积极的迁移效果，从而能够利用英文名翻译成未经微调的语言。同时，研究了规模、预训练步数、微调语言数量和语言相似度等因素对该现象的影响。

Abstract

We explore the use of natural language prompts for controlling various aspects of the outputs generated by machine translation models. We demonstrate that →

natural language prompts machine translation models multilingual translation models transfer learning language similarity

发现论文，激发创造

大语言模型的机器翻译：波斯语，英语和俄语方向的提示工程

通过研究生成式大型语言模型在机器翻译中的性能，我们发现多语言模型（如 PaLM）在人工翻译输出方面表现出类似人类的水平，能够根据样式指南和语言要求优化所需的翻译细微差别，并在处理和应用提示上表现出色。我们还针对流行的语言模型作为机器翻译工具的错误和限制进行了分类和提出了设计提示进行上下文学习的方法。通过改进评估指标的准确性和可靠性，我们的研究旨在促进生成式大型语言模型在机器翻译中的进步。

Jan, 2024

机器翻译中的大型语言模型：案例研究

通过系统研究提示策略，我们填补了机器翻译领域中提示还未得到充分探索的空白区域，证明了使用优质的提示样本能够有效地提高机器翻译的性能。

Jan, 2023

非自然语言处理：语言模型如何处理机器生成的提示？

语言模型提示优化研究表明，通过无明显意义或语法结构的自动生成的令牌序列，包括模型嵌入空间中的向量序列，通常胜过语义和语法良好的手工制作的提示。我们使用机器生成的提示来探究模型对非自然语言表达组成的输入的响应，并在多个语义任务中研究不同尺寸模型的行为，以及它们对连续和离散机器生成的提示和人工生成的自然语言提示的响应行为进行比较。即使产生相似的输出，机器生成的和人工提示通过网络处理途径触发不同的响应模式，包括不同的困惑度、不同的注意力和输出熵分布，以及不同的单元激活特征。我们提供了对不同提示类型激活的单元性质的初步洞察，表明只有自然语言提示才会引起真正的语言电路的激活。

Oct, 2023

基于词典短语级别的大语言模型提示用于机器翻译

本研究通过利用双语词典的先验知识提供提示，提出了一种新的 DiPMT 方法，可以有效解决 LLM 在低资源机器翻译和领域转移情况下难以翻译生僻词的问题，并且实验结果表明 DiPMT 能够提高 LLM 的翻译性能。

Feb, 2023

插入并玩：一种控制文本生成的提示调整方法

利用小型语言模型进行 Prompt 调整，使用提示嵌入对生成文本进行控制，验证其在情感分析、正式度和有害语言领域的有效性。

Apr, 2024

使用翻译记忆增强大型语言模型翻译器

利用翻译记忆作为提示是一种有前途的机器翻译模型上下文学习方法，本文通过使用大型语言模型进行提示，发现 LLM 的‘理解’提示的能力确实有助于更好地利用 TMs，并通过实验证明，使用高质量的 TM 提示可以大大改善预先训练的 LLM 翻译器的结果，甚至可以与最新状态下大规模领域内双语数据和针对下游任务进行调整的 NMT 系统的结果相媲美。

May, 2023

逆向提示控制预训练语言模型的生成

该研究提出了一种新颖的方法，逆提示（inverse prompting），通过使用生成文本对提示进行逆向预测，以增强提示和生成文本之间的相关性并提高可控性，实证研究表明该方法在生成文本的开放领域有着很好的表现，该研究提供的代码可供研究者使用。

Mar, 2021

如何控制对话模型：提升对话质量的方法

本文探讨了如何在对话模型中平衡训练文本的多样性和生成对话样式的限制，研究表明，通过将提示信息与查询进行绑定，可以实现更高质量的多样化回复。

Sep, 2022

AutoPrompt: 使用自动生成的提示从语言模型中引导知识

利用自动化方法生成的 AutoPrompt，我们展示了预训练语言模型在自然语言推理、情感分析和关系提取方面的潜在能力，以及自动生成的提示方法是现有探究方法的一个可行的无参数替代方法。

Oct, 2020

离散信息提取提示能否在语言模型之间推广？

该论文研究了利用自动诱导的提示从语言模型中提取信息的能力是否可以被直接应用于探索其他语言模型。在证实了自动提示优于手动和半手动提示的插槽填充任务后，我们证明了在一个模型上学习并在另一个模型上进行测试的 AutoPrompt 提示效果下降。我们介绍了一种混合语言模型来诱导提示的方法，以获得可以在多个模型之间广义的提示。我们对诱导提示进行了全面分析，发现更通用的提示包括更大比例的现有英语单词，其组成部分信息的分布更少依赖顺序并且更加均匀。我们的研究提供了初步证据表明可能生成可诱导一次并与许多不同模型一起使用的离散提示，并提供关于表征此类提示的属性的见解。

Feb, 2023