可扩展的语言模型提示

Dec, 2022

Extensible Prompts for Language Models

Tao Ge, Jing Hu, Li Dong, Shaoguang Mao, Yan Xia...

TL;DR提出了一种名为 X-Prompt 的方法，通过引入虚构单词的可扩展词汇表，指导大型语言模型（LLM）完成超越自然语言的任务，使得提示更具描述性，并实现了上下文引导学习及提示增强，从而使其虚构单词可以用于不同的提示上下文，以达到精细的规范。该方法在人类与 LLMs 间构建了通信桥梁，有望实现更高级的交互。

Abstract

We propose extensible prompt (X-Prompt) for prompting a large language model (LLM) beyond natural language (NL). X-Prompt instructs an LLM with not only NL but also an extensible vocabulary of →

extensible prompt large language model imaginary words context-guided learning communication gap

发现论文，激发创造

大型语言模型的自动提示选择

自动选择给定输入的最佳提示，克服手动设计有效提示的挑战，通过聚类训练数据、生成候选提示、生成输入 - 提示 - 输出数据集以训练评估器，并使用评估器在测试时选择最佳提示来实现兼顾通用性和特异性的方法。在零 - shot 问答数据集上显示出竞争性性能。

Apr, 2024

大型语言模型的高效提示方法综述

在这篇论文中，我们对高效提示的各种方法进行了全面的概述，包括使用高效计算和高效设计进行提示的方法，重点关注未来的研究方向。

Apr, 2024

LLMs 中并非所有语言的质量相同：通过跨语言思维提示提高多语言能力

本研究提出了一种名为跨语言思维提示（XLT）的方法，通过激发跨语言和逻辑推理技能，改善了大语言模型的多语言能力，并在与推理、理解和生成有关的 7 个基准测试中进行了全面的评估，实验结果显示 XLT 不仅显著提高了各种多语种任务的性能，而且还显著减少了不同语言中每个任务平均性能和最佳性能之间的差距。

May, 2023

Prompt2Model: 从自然语言指令生成可部署的模型

通过 Prompt2Model 方法，可以使用少量的提示，训练出性能优异、体积小 700 倍的特定目的模型，用于自然语言处理任务。

Aug, 2023

基于大型语言模型的交互式和可视化提示工程，用于即席任务适应

本文介绍了一种使用神经语言模型的 zero-shot prompting 方法，在不需要监督训练的情况下解决 ad-hoc 语言任务。我们提出了 PromptIDE 工具，该工具可以帮助用户实验不同的提示词选择，以达到任务指标的优化和数据量的扩展。该工具已在多个现实世界的案例中得到了应用。

Aug, 2022

XCoOp：基于概念引导的上下文优化的计算机辅助诊断可解释式提示学习

利用强大的视觉 - 语言模型（VLM）来完成各种下游任务已引起越来越多的关注。我们提出了一种新颖的可解释提示学习框架，通过在多个粒度上对医学知识、可以学习的提示和临床概念驱动的提示的语义进行对齐，来解决这个问题，并为提示提供了视觉和文本解释。通过对各种数据集进行广泛的实验证明，我们的方法同时实现了优越的诊断性能、灵活性和可解释性，为基础模型在促进可解释的人工智能方面的有效性提供了新的视角。

Mar, 2024

激发即编程：大型语言模型的查询语言

本文提出了一种 Language Model Programming（LMP）的全新方法，以将纯文本提示扩展为文本提示和脚本的直观组合，并允许指定约束条件，从而实现对下游任务的易于适应性。通过实现 LMQL（Language Model Query Language）来实现 LMP 的支持，并证明了其在保持或提高下游任务准确性的前提下，大大减少了计算的成本。

Dec, 2022

跨语言模型预训练的软语言聚类技术

本文提出了 XLM-P 模型，结合上下文获取灵活的编码，实现语言无关以及语言特定知识的轻量级建模，且可以与其他多语言预训练方法轻松集成，提供用于文本分类、序列标记、问答和句子检索的性能改进，对于低资源语言和跨语言传输具有实际优势。

Jun, 2023

对话模型的节约提示

研究了使用大型语言模型建立对话系统的不同方法，并分析了对话历史的表示方式，提出了一种更紧凑的提供对话历史信息的方法，从而有效减少模型 API 的成本。

May, 2023

XPrompt：通过联合提示归因解释大型语言模型的生成

该研究引入了基于联合提示归属的反事实解释框架 XPrompt，旨在解释少数提示文本是如何共同影响大型语言模型（LLM）的完整生成，并通过定义和利用多个评估指标来展示我们框架的忠实度和效率。

May, 2024