对话作为不确定性下的行为
有效的对话者必须考虑他人的不确定目标、信念和情绪,但是即使是最好的人类对话者也无法完美地预测对话的轨迹。我们提出了 FortUne Dial,对长期存在的 “对话预测” 任务进行了扩展:不仅评估准确性,还使用了具有不确定性意识的度量标准,有效地使个别实例中可以放弃预测。我们研究了语言模型在代表对话结果不确定性方面的两种方式(内部使用分数,直接使用标记),并提出了改进这两种表示的校准的微调策略。在八个困难的谈判语料库上的实验证明,我们提出的微调策略(传统的监督策略和离线策略增强学习策略)能够使规模较小的开源模型与其体积为 10 倍的预训练模型竞争。
Feb, 2024
本篇论文提出了基于贝叶斯模型和不确定性感知的信息寻求模型,以解决视觉对话问题中 agent 提出问题的困难。实验结果表明,在两种挑战性的问题中,我们的方法都优于其它相应的方法。
Dec, 2018
使用基于簇的语言模型方法解决面向目标对话系统中的对话学习问题,在 DSTC6 挑战赛中应用于餐厅预订系统;结果表明,该技术在选择正确候选话语方面达到了高准确性,并且优于基于神经网络的其他现有方法。
Dec, 2018
本文提出了一种使用统一的隐式对话框架来进行面向目标,信息搜寻任务的会话搜索应用的方法,该方法可以利用底层数据表示来构建对话交互所需的组件,该框架由一系列端到端可训练模块的管道组成,其中集中的知识表示被用于语义地连接多个对话模块,各种工具被集成到该框架中以获取最终用户的输入以持续改进该系统,该方法的目标是通过识别可以适应和重复使用于许多最终用户应用程序中的组件和数据来促进对话系统的开发,我们通过为几个独立领域创建对话代理来展示我们的方法。
Feb, 2018
在本文中,我们针对视觉 - 语言人工智能系统提出了关于不确定性的分类法,区分了由于信息缺乏而产生的认识不确定性和由于固有不可预测性而产生的因果不确定性,并进一步探讨了更加精细的分类。基于这个分类法,我们构建了一个对比性数据集 CertainlyUncertain,其中包含 178K 个视觉问答样本,通过对图像进行修复使原本可以回答的问题变为不可回答,并利用图像标题来引发大型语言模型回答可回答和不可回答的问题。此外,我们引入了一项新的指标 —— 置信加权准确率,它与准确率和校准误差都具有很好的相关性,以解决现有指标的不足之处。
Jul, 2024
提出了一种新的口语会话问答任务(SCQA),旨在使系统能够模拟复杂的对话流程,以便处理音频记录中的对话式问题,并探索从不同模态提供更多线索,通过 DDNet 方法有效地摄取跨模态信息以实现语音和语言模态的细粒度表示,并通过双向关注机制鼓励更好的音频和文本之间的对齐,以简化知识转移过程。通过 Spoken-CoQA 数据集,证明了跨模态信息融合的必要性,同时证明了提出的方法在口语会话问答任务中具有卓越的性能表现。
Apr, 2022
本文提出了一种自动回答关于图像的问题的方法,该方法结合了自然语言处理和计算机视觉的最新进展,采用多世界方法将离散推理与不确定预测结合起来,并在贝叶斯框架下表示对感知世界的不确定性。该方法能够处理有关现实场景的高难度的人类问题,并以计数、物体类别、实例和它们的列表等答案的范围进行回复。该系统直接从问题 - 答案对中进行训练。我们建立了该任务的第一个基准,可视为现代视觉图灵测试的一种尝试。
Oct, 2014
该论文关注使用大型语言模型进行决策规划,并通过不确定性估计来解决语言模型中的幻觉问题,提出了非参数化的不确定性量化方法和决策代理设计的系统化方法,为人工智能代理的开发提供了一种高效的成本有效途径。
Feb, 2024
通过模拟、激励和奖励机制,引入了一种名为不确定性思考(UoT)的算法来提高大型语言模型在主动寻求信息方面的能力。在医学诊断、故障排除和 '20 个问题 ' 游戏的实验中,UoT 相较于直接提示的方式,在成功完成任务的速度上平均提高了 57.8%,同时也提高了任务完成所需的效率(即问题数量的减少)。
Feb, 2024
通过结合智能技术和通信与协作,本研究提出了数字通信媒体的三个关键设计概念,包括面板基底、基于语言的意图识别和轻量级交互技术,并开发了名为 CrossTalk 的视频会议系统来实现这些概念,从而实现了更流畅灵活的通信和协作体验。
Aug, 2023