极限条件下的语言生成

Apr, 2024

Language Generation in the Limit

Jon Kleinberg, Sendhil Mullainathan

TL;DR使用基本规范并且不需要进一步的假设，我们的主要研究结果是针对每个可计数的候选语言列表，都存在一个能够在极限情况下生成的代理模型，与用于识别未知语言的语言学习模型产生截然不同的结果，这表明识别语言和从中生成语言是根本不同的问题。

Abstract

Although current large language models are complex, the most basic specifications of the underlying language generation problem itself are simple to state: given a finite set of training samples from an unknown l

language models language generation adversary target language language learning

发现论文，激发创造

限制性神经语言生成为什么特别具有挑战性？

该研究论文系统梳理了存在于神经语言生成技术中的问题，并分别从文本生成任务、方法和评估度量指标三个方面，详细阐述了约束条件和条件约束这两种情况，并总结了当前约束神经语言生成技术的研究进展和面临的主要挑战，以期提高该领域的技术水平。

Jun, 2022

不可能任务的语言模型

GPT-2 struggles to learn synthetic impossible languages, challenging the claim that large language models are equally capable of learning languages that are impossible for humans, highlighting the need for further investigation into different LLM architectures for cognitive and typological studies.

Jan, 2024

LimGen: 探测 Landscape Language Models 生成研究论文建议性限制

本研究介绍了一项新的挑战性任务，即通过综合研究论文的相关挑战、实践见解和潜在机遇，利用大型语言模型生成研究论文的建议性局限，我们构建了包含 4068 篇研究论文及其相关局限的 LimGen 数据集。

Mar, 2024

解锁预期文本生成：一种受限方法用于大型语言模型的忠实解码

通过将文本生成问题形式化为未来约束生成问题，以最小化不良行为并确保指令的忠实执行，本文介绍了利用 LLM 的未来约束满足估计来指导文本生成过程的方法，并通过对关键词受限生成、有害性降低和问答中的事实正确性等三个不同的文本生成任务进行了广泛的实验，证明了该方法的有效性。

Dec, 2023

大型语言模型的局限性、危害和风险的放大

本文介绍了人工智能（AI）领域中的基础和大型语言模型（LLMs）等技术的限制和风险，并且警告使用这些技术会带来的伤害。

Jul, 2023

面向约束句子生成的前向和后向语言建模

本研究提出了一种新的前向后向语言模型，能够在特定词的约束下生成自然语言文本，表现优于传统的顺序语言模型。

Dec, 2015

使用语言模型的学习界限

本文研究大语言模型在自然语言处理中的局限性，特别是无法学习一些基本语义属性，如语义蕴涵和一致性，以及不能学习超越 Borel 层次结构的概念，这对语言模型的语言理解能力产生了严重限制。

Jun, 2023

大型语言模型的有约束文本生成的综合评估

通过在大型语言模型中引入详细的约束条件，本研究调查了约束文本生成的问题，并对多个语言模型进行了分类和评估，旨在为未来的约束文本生成提供启示。

Oct, 2023

GenTranslate：大型语言模型是生成式跨语音和机器翻译器

利用大型语言模型的丰富语言知识和强大的推理能力，我们提出了一种新的生成式翻译范式 ——“GenTranslate”，可以从 N 个候选译文中生成更高质量的翻译结果，并且在各种语音和机器翻译基准测试中明显优于现有模型。

Feb, 2024

利用大型语言模型进行文本分类的合成数据生成：潜力与局限性

通过研究 LLM 生成的合成数据的表现与分类的主观性之间的关系，我们发现主观性对于模型训练的合成数据的性能具有负面影响，从而限制了利用 LLM 进行合成数据生成的潜力和局限性。

Oct, 2023