学习预测常识生成的概念排序

Sep, 2023

Learning to Predict Concept Ordering for Common Sense Generation

Tianhui Zhang, Danushka Bollegala, Bei Peng

TL;DR通过对多个语言模型（LMs）和概念排序策略进行系统研究，我们发现使用 BART-large 模型在按照 CommonGen 训练数据中概念顺序进行微调时，表现始终优于其他所有考虑到的 LMs，并通过多个评估指标进行了衡量；此外，即便使用专门针对该任务的训练数据进行微调，更大的基于 GPT3 的大型语言模型（LLMs）变体在此任务上也未必表现更好；有趣的是，人工标注者在手动编写涵盖这些概念的句子时会显著调整输入的概念顺序，并且无论生成时使用的 LM 如何，这种排序都能提供最好的句子生成结果，超过了基于概率的概念排序基线。

Abstract

Prior work has shown that the ordering in which concepts are shown to a commonsense generator plays an important role, affecting the quality of the generated sentence. However, it remains a challenge to determine the optimal ordering of a given set of concepts such that a natural sente

concept ordering commonsense generator language models fine-tuning sentence generation

发现论文，激发创造

重新审视生成式常识推理：一种预排序方法

本文研究了预训练模型的常识知识，提出使用预排序方法以改变输入概念的顺序，进而并非依靠外部知识和资源，有效提高模型的常识推理能力。

May, 2022

机器翻译生成顺序的实证研究

本文通过实证研究生成顺序来探讨机器翻译的效果，发现对于英德翻译任务，以字母和最短优先等方式生成的效果相当于标准 Transformer 生成的效果，提出了不必严格遵循从左到右的翻译方式。而对于英中翻译任务，由于语言对齐度低，生成的效果则对生成顺序更加敏感。

Oct, 2019

大型语言模型推理中前提顺序重要性

大语言模型在各个领域中取得了非凡的推理性能。然而，在推理任务领域中，我们发现一个脆弱之处：尽管这种排序不会改变基本任务，但大语言模型对前提的排序非常脆弱。

Feb, 2024

BOOST：利用黑盒控制提升 LM 生成中的常识

我们提出了一种计算高效的框架，通过引导一个固定的预训练语言模型向更具常识的生成方式迈进，以产生一个合理的输出，该输出以一系列概念有意义的方式融合。测试结果表明，我们的方法在两个有限概念生成句子的基准上始终能够产生最具常识性的输出。

Oct, 2023

预训练语言模型在词序中的作用：以 BART 为例的案例研究

使用 BART 语言生成模型进行词序排序能够提高性能，其作用原因是 BART 模型中的句法依赖知识。相关线性化任务也可得到改进。

Apr, 2022

奇妙有序提示的发现之处：克服少样本提示顺序敏感性

通过确定培训示例的排列顺序，本文研究了少样本学习，探究其对预训练语言模型在文本分类任务上的表现，结果发现使用示例的循序排列可以提升 13% 的性能。

Apr, 2021

语言模型中生成顺序的重要性

这篇研究通过一种新颖的双通路语言模型研究了单词生成顺序对模型质量的影响，发现先生成功能词，再生成内容词的策略最为有效。

Aug, 2018

词序的影响：重新排序和生成分析的见解

在本文中，我们通过添加一种顺序重构的视角并选择不同范围的数据集，重新审视了关于词序的假设，包括 “词序与词汇语义冗余” 和 “模型不依赖词序”。实证结果支持 ChatGPT 在推断中依赖于词序，但不能支持或否定词序与词汇语义之间的冗余关系。

Mar, 2024

通过常识知识的提取和注入进行词汇限制的文本生成

本论文中，我们探讨如何运用常识知识图谱提高条件文本生成模型的综合性能，通过从 Conceptnet 中提取常识关系，将这些关系注入到 Unified Language Model (UniLM) 中，并通过输出约束强制实施词汇要求，以提高生成文本的语义正确性和符合人类理解，从而实现了匹配词性和完全概念覆盖的要求。

Dec, 2020

一切都有序吗？一个简单的排序句子的方法

该研究提出了一种基于 Transformer 模型的 Reorder-BART 方法，旨在将文本中的乱序句子整合为有条理的文本，并在 7 个数据集上取得了较优的结果。其在零样本情况下也表现出良好的泛化能力。

Apr, 2021