控制的好奇案例

EMNLPMay, 2022

The Curious Case of Control

Elias Stengel-Eskin, Benjamin Van Durme

TL;DR大规模生成语言模型的输出结果与语义启发式算法一致，但其中最大的一组模型在主语控制方面表现优异，而在宾语控制方面则表现不佳；通过使用代理 - 患者信息，可以显著地改变大多数模型的输出结果，我们进一步利用语义原型角色注释探讨了控制与事件参与者标签属性之间的联系。

Abstract

Children acquiring English make systematic errors on subject control sentences even after they have reached near-adult competence (C. Chomsky, 1969), possibly due to heuristics based on semantic roles (Maratsos, 1974). Given the advanced fluency of large generative language models, we

subject control sentences generative language models semantic heuristics object control proto-role annotations

发现论文，激发创造

汉语语言模型中语法知识的受控评估

我们研究了结构化监督在汉语中的效果，结果表明结构化监督可以帮助语言模型学习句法和语义关系，并且在低数据情况下表现出更好的性能。

Sep, 2021

对大型语言模型在受控生成任务中的评估

大型语言模型在生成任务中的可控性和精细硬性约束方面存在挑战。

Oct, 2023

具备语法样例的可控释义生成

本文提出一种新颖的任务，通过神经模块来控制句子的语法以及运用多任务训练的目标来提高表示学习，从而实现可控文本生成，并在基线实验的基础上实现性能的提升和捕捉理想特征。

Jun, 2019

面向目标的语法评估语言模型

该研究提出了使用一个语言模型预测的句子的语法正确性来评估该模型的数据集。实验结果表明，在众多句子变体中，LSTM 语言模型的准确性较差，而使用句法目标的多任务训练可以提高模型的准确性，但模型仍存在较大的进步空间。

Aug, 2018

部分词性归纳中的复杂度控制

该研究针对无标注文本完全无监督学习语法 (词性) 类别的问题，通过参数和非参数约束对标准的最大似然隐马尔可夫模型进行优化和修改和达到了在多种语言上显著提高的效果。

Jan, 2014

循环神经网络语言模型总是学习类似于英语的关系从句连接

通过使用模糊性相对子句附加来扩展语言模型在多重同时有效解释的情况下的评估方法。我们比较了英语和西班牙语模型的表现，以展示 RNN LMs 中的非语言偏见优势重叠在英语而非西班牙语的句法结构上。因此，英语模型可能具有类似于人类的句法偏好，而在西班牙语上训练的模型无法获得类似的人类句法偏好。

May, 2020

因果干预揭示了常识语言理解中的隐含情景模型

通过对最近的变形器模型应用因果干预技术分析了词义消歧问题上 “情境模型” 的表现，特别是注意头回路在隐含情境模型建立中发挥的作用及其通过不同路径对代词解析的引导方式进行比较。

Jun, 2023

核指解析模型的有控重评

通过系统评估五个核心指代消解模型并控制每个模型使用的预训练语言模型，我们发现在语言模型大小相同的情况下，基于编码器的核心指代消解模型在准确性和推理速度方面优于更近期的基于解码器的模型，并且我们测试的最古老的核心指代消解模型在跨领域文本体裁中表现最好。最后，我们得出结论：控制语言模型的选择可以减少过去五年间 F1 分数的增长，尽管无法完全消除该增长。

Mar, 2024

受控文本生成的不变特征学习表征

本文探讨了在生成文本中使用分类器控制文本的生成过程中，生成的文本分布与分类器训练集不一致所导致的问题，并提出了一种基于不变性学习的解决方案和选择自然环境的启发式策略。通过实验，本文证明了分布转换对于生成文本的困难性以及不变性方法在解决这个问题上的潜力。

May, 2023

用神经自然语言生成器控制基于个性的风格变化

本文探讨了自然语言生成在任务导向对话中的应用，提出了三种序列到序列模型，并考虑如何实现内容和风格的分离，通过控制 36 个风格参数，实现对语义和风格的高度还原。

May, 2018