基于场景的澄清标注配方

ACLApr, 2021

A recipe for annotating grounded clarifications

Luciana Benotti, Patrick Blackburn

TL;DR本文提出对话澄清机制是自然语言理解中一个未被充分研究的关键问题，并讨论了该问题的理论背景、实际挑战和获取基础注释的方法。同时，还提出了需要在未来研究中解决的伦理问题。

Abstract

In order to interpret the communicative intents of an utterance, it needs to be grounded in something that is outside of language; that is, grounded in world modalities. In this paper, we argue that dialogue clarification mechanisms make explicit the process of interpreting the

dialogue clarification mechanisms communicative intents grounding annotations natural language understanding ethical issues

发现论文，激发创造

走向利用大型语言模型实现对会话基础的理解

这篇实验研究分析了信息寻求对话中大型语言模型在分类明示或隐含对话转换以及预测对接知识元素方面的能力，并揭示了大型语言模型在这两个任务中遇到的挑战，讨论了通过流程架构和知识库改进大型语言模型的对话接地理解的研究工作，在对话中处理对接知识的复杂性方面，旨在开发更加有效的对话系统。

Jun, 2024

对话基础：基础行为和基础单元的注释与分析

此研究提供了通过使用对话中的对接行为和对接单元进行标注的两个对话语料库及其对接程度的度量，以测试当前的语言模型在对话的对接行为分类中的性能，并旨在进一步研究使与机器的对话更易理解和更可靠的资源。

Mar, 2024

一份地标解析标注语料库，用于解释共同基础

该论文提出了一种新的资源来研究对话系统中共同的理解过程的中间环节，通过一种简单且通用的注释模式，收集了来自现有语料库中的 5,191 个对话中的 40,172 个参照表达式，并展示了该注释的高可靠性和捕获共同理解复杂性的能力，最终证明了该注释在解释、分析和改进基线对话系统方面的优越性。

Nov, 2019

关于用监督学习建模元交际基础行为的局限性

参与主动对话对于建立共同基础至关重要，因为理解是由发出者和接收者共同塑造的；偷听者无法执行基础行为，只能猜测意图，数据生成、注释、建模、训练和评估自然语言处理对话模型仍依靠这种偷听范式，然而，正如我们展示的那样，有证据表明无法通过数据驱动的学习模型来正确地建模人类元交际行为，本文讨论了这个问题，并对人类在请求澄清方面的决策变化进行了初步分析，最重要的是，我们希望将这个主题重新提到社区的议程中，鼓励关于仅设计为 “偷听” 的模型后果的讨论。

May, 2024

语言处理的多模态基础

本文讨论多模态处理的最新进展，探讨了多模态信息流和不同的多模态表示方法，讨论了多模态基础对于语言处理任务的益处和挑战。特别着重研究动词的多模态基础，对语言的组成能力起着重要作用。

Jun, 2018

基于方法的地基和全面发展：跨模态和跨语言连接研究的一种方法论

通过建立一种方法论框架，对比训练在不同输入模态下的模型，本文研究了提供比仅有文本更丰富的输入来源对自然语言处理系统的影响，发现交叉模态接地、跨语言接地和未接地的模型之间存在质的差异，这从整体数据集层面和具体词表示层面衡量了模型的表现。

Oct, 2023

基于空间表达的视觉对话的语言分析

本文介绍了一个新的资源和框架，用于研究在视觉基础对话中细化语言理解，该资源包括 OneCommon 语料库、空间表达式、基于参考解析评估模型对语言结构理解的实验等，通过提供全面和可靠的语言结构注释，揭示了基线模型的优缺点。

Oct, 2020

基于实境的语言学习中的语用学问题、任务和建模方法

人们通过上下文来丰富文字表达，实现简洁而有效的沟通，为了让人工智能系统能够与人类进行自然交互，需要强调语用学技能，从分享语言目标和约定到视觉和肢体世界中的语境等，利用各种上下文信息有效地运用语言。本文调查现有的语境实现和语用模型方法，并分析了每个工作中的任务目标、环境语境和沟通便利之间的关系，从而丰富了语言含义。我们提出了关于未来基于任务设计的语境需求，以自然地引出语用现象的建议，并建议在更广泛的沟通语境和便利方面继续探索。

Nov, 2022

文本蕴含基础

本文研究了文本蕴涵中的语义关系 —— 通过可能世界来分析前提和假说之间的关系，同时结合图像进行多模态的分析，结果表明文本和视觉信息相结合可以更好地进行文本蕴涵，但当前多模态模型在 “接地” 方面还不够优化。

Jun, 2018

基于共识的对话游戏：强调视觉对话环境中的交流基础

本文介绍了一种通过协议达成共识的对话设置，除任务级别目标外，还有一个次要的、显式的目的 —— 达成对任务级别目标是否达成的共识 —— 使得会话参与者更关心彼此的理解，从而产生更丰富的数据以推导模型。

Aug, 2019