基于场景的澄清标注配方
这篇实验研究分析了信息寻求对话中大型语言模型在分类明示或隐含对话转换以及预测对接知识元素方面的能力,并揭示了大型语言模型在这两个任务中遇到的挑战,讨论了通过流程架构和知识库改进大型语言模型的对话接地理解的研究工作,在对话中处理对接知识的复杂性方面,旨在开发更加有效的对话系统。
Jun, 2024
此研究提供了通过使用对话中的对接行为和对接单元进行标注的两个对话语料库及其对接程度的度量,以测试当前的语言模型在对话的对接行为分类中的性能,并旨在进一步研究使与机器的对话更易理解和更可靠的资源。
Mar, 2024
该论文提出了一种新的资源来研究对话系统中共同的理解过程的中间环节,通过一种简单且通用的注释模式,收集了来自现有语料库中的 5,191 个对话中的 40,172 个参照表达式,并展示了该注释的高可靠性和捕获共同理解复杂性的能力,最终证明了该注释在解释、分析和改进基线对话系统方面的优越性。
Nov, 2019
参与主动对话对于建立共同基础至关重要,因为理解是由发出者和接收者共同塑造的;偷听者无法执行基础行为,只能猜测意图,数据生成、注释、建模、训练和评估自然语言处理对话模型仍依靠这种偷听范式,然而,正如我们展示的那样,有证据表明无法通过数据驱动的学习模型来正确地建模人类元交际行为,本文讨论了这个问题,并对人类在请求澄清方面的决策变化进行了初步分析,最重要的是,我们希望将这个主题重新提到社区的议程中,鼓励关于仅设计为 “偷听” 的模型后果的讨论。
May, 2024
本文讨论多模态处理的最新进展,探讨了多模态信息流和不同的多模态表示方法,讨论了多模态基础对于语言处理任务的益处和挑战。特别着重研究动词的多模态基础,对语言的组成能力起着重要作用。
Jun, 2018
通过建立一种方法论框架,对比训练在不同输入模态下的模型,本文研究了提供比仅有文本更丰富的输入来源对自然语言处理系统的影响,发现交叉模态接地、跨语言接地和未接地的模型之间存在质的差异,这从整体数据集层面和具体词表示层面衡量了模型的表现。
Oct, 2023
本文介绍了一个新的资源和框架,用于研究在视觉基础对话中细化语言理解,该资源包括 OneCommon 语料库、空间表达式、基于参考解析评估模型对语言结构理解的实验等,通过提供全面和可靠的语言结构注释,揭示了基线模型的优缺点。
Oct, 2020
人们通过上下文来丰富文字表达,实现简洁而有效的沟通,为了让人工智能系统能够与人类进行自然交互,需要强调语用学技能,从分享语言目标和约定到视觉和肢体世界中的语境等,利用各种上下文信息有效地运用语言。本文调查现有的语境实现和语用模型方法,并分析了每个工作中的任务目标、环境语境和沟通便利之间的关系,从而丰富了语言含义。我们提出了关于未来基于任务设计的语境需求,以自然地引出语用现象的建议,并建议在更广泛的沟通语境和便利方面继续探索。
Nov, 2022
本文研究了文本蕴涵中的语义关系 —— 通过可能世界来分析前提和假说之间的关系,同时结合图像进行多模态的分析,结果表明文本和视觉信息相结合可以更好地进行文本蕴涵,但当前多模态模型在 “接地” 方面还不够优化。
Jun, 2018
本文介绍了一种通过协议达成共识的对话设置,除任务级别目标外,还有一个次要的、显式的目的 —— 达成对任务级别目标是否达成的共识 —— 使得会话参与者更关心彼此的理解,从而产生更丰富的数据以推导模型。
Aug, 2019