生成和跟随指令的统一语用模型

ACLNov, 2017

Unified Pragmatic Models for Generating and Following Instructions

Daniel Fried, Jacob Andreas, Dan Klein

TL;DR使用显式的实用推断对于复杂的序列任务生成和遵循自然语言指令是有帮助的，研究表明实用推断可以提高在不同环境下生成和理解自然语言指令的效果。

Abstract

We show that explicit pragmatic inference aids in correctly generating and following natural language instructions for complex, sequential tasks<

pragmatic inference natural language instructions sequential tasks language generation interpretation

发现论文，激发创造

使用神经听者和说者推理语用学

我们提出了一个基于先验推理和学习语义结合的思想来描述场景的模型，成功率高于现有技术。

Apr, 2016

实用信息文本生成

本文利用计算语用学中的技术，将语言生成模型的建模过程形式化为说话者和听者之间的游戏，通过两种语用建模方法，即保留信息和建模干扰项，来提高抽象概括和结构化含义表述的生成系统的性能。

Apr, 2019

人类与语言模型的语用语言理解的精细比较

本文通过在英语材料的专家评估集上进行零 - shot 提示，进行了人类和语言模型在七个语用现象上的精细比较，发现最大的模型可以实现高精度和匹配人类错误模式，同时发现证据表明模型和人类对相似的语言提示敏感，旨在探讨人类语用处理机制和语言模型之间的关系。

Dec, 2022

用于视觉与语言导航的说话者 - 跟随者模型

本研究提出了一种使用内置语音模型的视觉 - 语言导航方法，该方法利用演讲者模型来合成新的指令进行数据增强，并实现了实用推理和全景动作空间，大大提高了基线指令跟随者的性能，在标准基准测试中成功率超过现有最佳方法的两倍。

Jun, 2018

通过合作的语言引导逆向规划实现务实指令遵循和目标协助

该研究介绍了合作语言引导的逆向计划搜索 (CLIPS)，这是一种贝叶斯代理架构，用于灵活、上下文敏感地遵循指令，提供目标协助。通过模型化人类为合作规划者，对动作和语言进行多模态贝叶斯推理，使用大型语言模型 (LLMs) 评估指令在假设计划下的可能性，辅助代理最小化预期目标达成成本，即使对目标存在不确定性，也能实现对模棱两可指令的实用跟踪和有效协助。在两个合作规划领域 (Doors, Keys & Gems 和 VirtualHome) 中评估了这些能力，发现 CLIPS 在准确性和帮助性方面明显优于 GPT-4V、基于 LLM 的字面指令跟踪和单模态逆向计划，并与人类评分者提供的推理和协助判断非常接近。

Feb, 2024

基于实境的语言学习中的语用学问题、任务和建模方法

人们通过上下文来丰富文字表达，实现简洁而有效的沟通，为了让人工智能系统能够与人类进行自然交互，需要强调语用学技能，从分享语言目标和约定到视觉和肢体世界中的语境等，利用各种上下文信息有效地运用语言。本文调查现有的语境实现和语用模型方法，并分析了每个工作中的任务目标、环境语境和沟通便利之间的关系，从而丰富了语言含义。我们提出了关于未来基于任务设计的语境需求，以自然地引出语用现象的建议，并建议在更广泛的沟通语境和便利方面继续探索。

Nov, 2022

序列语言博弈中的规划、推理和语用学

研究顺序语言游戏中的私人信息通信，并提出能够捕获人类行为的模型。

May, 2018

生成实用示例用于训练神经程序合成器

本文提出了一种使用神经网络在编程示例中选择信息性数据集的新方法，并在合成正则表达式任务上验证了该方法的有效性，相对于不选择信息性示例训练的模型，其性能提高了 23％（相对增长了 51％），并且与使用人类数据进行训练的监督学习模型的表现相当。

Nov, 2023

语言模型是实用演讲者

本文通过概率认知模型解释了语言模型的运行方式，尤其是展示了通过强化学习从人类反馈中优化的大型语言模型实现了一种类似于 Kahneman 快慢思考模型的思维模型，并讨论了强化学习作为快慢思考模型的局限性，并提出了扩展此框架的方向。总的来说，我们的工作表明，通过认知概率建模的视角来理解、评估和发展语言模型可以提供有价值的见解。

May, 2023

如何与人工智能对话：指令，描述和自主性

研究从语言中学习以实现语言使用与机器智能的价值对齐，分析了两种不同类别的语言，即指令和描述，运用上下文强化学习进行形式化的建模，并且验证了这种社会学习方法在传统的强化学习任务中可以降低遗憾值。

Jun, 2022