模拟对话智能在聊天中的研究工作坊发现
本研究分析了神经网络开放领域对话系统所学习的内部表示,并评估了这些表示的质量以学习基本的交谈技巧。结果表明,标准的开放领域对话系统难以回答问题、推断矛盾并确定对话话题等任务,需要更多的研究来探讨建筑和训练方法,从而更好地捕捉有关对话的高级信息。
Jun, 2020
本文介绍了把目标导向式对话任务(TOD)系统和非目标导向闲聊式对话系统(ODD)结合起来的难题,并基于流行的TOD数据集MultiWOZ构建一个包含两种对话模式交替的新数据集FusedChat,提供一种更具挑战性的基准测试,以测试对话模型在处理交叉模式上的表现。该数据集具有丰富的依赖模式,包括共示和省略,并提供了分类和融合等基线模型。
Sep, 2021
该论文调查了现有的开放领域对话人工智能模型,并提出目前存在的主要挑战,同时提供性别统计数据以引发相关伦理讨论。研究认为,虽然最新的技术有了很大进步,但仍需解决许多问题,并且女性模型相对男性模型更常见,混合模型比任何单一架构更具优势。
May, 2022
通过两项研究,本文阐述了当前的Open-domain chatbots的会话范围的局限性,建议使用“small talk”而非“open-domain”来描述目前的聊天机器人,同时提出需要改进评估方法以测试聊天机器人与其他语篇的对话。
Nov, 2022
本文提出ChatLLM网络,利用多个基于ChatGPT的对话语言模型协同解决问题的能力,加入了一种反向传递更新系统,展现了这个网络在问题解决方面的显著性能提升。
Apr, 2023
本研究提供了关于对话代理的主要特征、支持任务、相应的开放领域数据集以及用于基准测试这些数据集的方法的详细综述,强调了构建对话代理的关键因素,并提出了用于在不同任务之间建立统一基础模型的UNIT模型,本文作者还审查了用于测量对话代理绩效的评估策略并突出了有关对话AI领域未来研究的范围。
Jul, 2023
使用Topical-Chat数据集,我们训练了多个最先进的编码器-解码器对话模型,并进行了自动化和人工评估,以帮助在开放领域对话人工智能方面的进一步研究。
Aug, 2023
通过借鉴社会科学和人工智能界的广泛研究,我们提出了一套最大量、最大质量、最大相关度、最大方式、最大善意和最大透明度的法则,旨在描述有效的人工智能对话,并为评估和改进设计提供了规范指导。
Mar, 2024