- ACLBIPED: 面向 ESL 教育的教育学指导的辅导系统
通过构建一对一的人机英语辅导交互数据集(BIPED)并使用两步预测模型,我们实现了两种使用 GPT-4 和 SOLAR-KO 的 CITS 模型,并通过实验证明这些模型不仅可以模仿人类教师的风格,还可以运用多样且情境适宜的教学策略。
- 大型语言模型是假定的语义基础还是猜测?
现有的大型语言模型在构建共性时,假设存在共同基础,而无需使用对话行为,因此需要进一步研究人机交互中的共性问题。
- 通过少样本回复生成和排序实现对话系统中对话行为的可控生成
对话系统需要产生高语义可信度的能实现多种类型对话行为的回应。本文提出了一种新颖的少样本过度生成与排序方法来实现对话行为的可控生成,并将其与八种少样本提示方式进行了比较,其中包括使用文本风格转移方法从文本伪参考中生成。在生成过程中,我们开发了 - ACL基于双流建模的医学对话生成
本研究提出了一种 Dual Flow 增强型医疗对话生成框架 DFMed,通过提取对话历史中的医疗实体和对话行为来预测下一轮中要采取的实体和对话行为,模拟它们之间的转换,并使用两个顺序模型进行编码,运用交织组件增强协同作用,实验结果表明 D - 低资源和不平衡数据集下的强大教育对话行为分类器
本文介绍了如何通过优化样本分布的方式,提高智能辅导系统中对话行为(DA)分类器的准确性和鲁棒性,通过大规模实验进行验证,取得了良好的结果。
- 信息量的重要性:教育对话主动学习中的行动分类
本文研究了对话行为 (DAs) 分类器的训练方法,发现使用 Active Learning 方法可以减少人力标注成本以及提高标注样本信息性,从而更好地支持对 DA 的分类器。
- 多领域对话状态跟踪中考虑行为的槽 - 值预测
该研究针对对话系统中特定目标和本体的对话状态跟踪模型的可扩展性问题,提出了一种将对话行为融入到对话模型设计中,利用机器阅读理解预测跨域对话状态的方法,并在实验结果中表现出较高的准确度,为未来的面向任务的对话系统提供了对话状态设计的指导。
- EMNLP无监督学习层次化对话结构
这项工作引入了一种无监督的学习层次对话结构的方法,包括对话行为和子任务。结构显示对于三个会话级理解任务,包括对话模型的优化是有用的。此外,通过自动摘要,学习的有限状态子对话网络是可解释的。
- 神经模型在自动对话分析中的应用调查:朝着更好地融合社会科学
本文综述了一些新的神经架构,并探讨了将其应用到更加基本的对话特点,例如情绪,对话行为和协同建构。基于社会科学文献,本文的作者相信对话最基本、最核心的特征是其由两个或多个交流者在时间上共同建构。
- ACL多领域对话行为与响应同时生成
我们提出了一个神经共同生成模型,可以同时生成对话行为和响应,相比于现有的流水线方法,我们的模型可以保留多领域对话行为的语义结构并动态关注不同的对话行为,通过在 MultiWOZ 数据集上的测试,我们的模型在自动评估和人类评估中都比几种最先进 - ACLCrossWOZ: 一个大规模的中文跨领域任务导向对话数据集
本研究提出 CrossWOZ 数据集,这是中国首个大规模的跨领域 Wizard-of-Oz 任务导向数据集,包含了酒店、餐厅、景点、地铁和出租车等 5 个领域的 6k 对话会话和 102k 含有丰富对话状态和对话行为标注的发言。同时,数据集 - 跨领域会话 AI 的分层多任务自然语言理解:HERMIT NLU
我们提出了一个用于口语对话系统宽覆盖自然语言理解的新型神经架构,该架构采用层次多任务结构,具有自我注意机制、BiLSTM 编码器和 CRF 标签层。我们展示了该方法在对话行为和框架语义上获得了可喜的结果,并证明了其适用于注释为特定领域意图和 - 一种双重注意力的分层循环神经网络在对话行为分类中的应用
提出了一种基于双重注意力层级循环神经网络的对话行为分类模型,利用话题建模作为辅助任务和双任务特定注意力机制来捕捉对话行为和话题之间的交互信息,从而大大提高了 DA 分类的效果。
- 基于句子门控模型和对话行为优化的抽象化对话摘要
本论文旨在通过引入对话行为,设计一种基于句子门控机制的神经摘要模型,以更好地模拟对话行为和摘要之间的关系,从而提高其在 AMI 会议语料库上的性能表现。实验结果表明,所提出的模型相对于现有的基线表现有很大改善,突显出对话行为所提供的交互信号 - ICLR基于对话行为的可解释可控开放域对话生成
本文研究采用对话行为来模拟人类社交聊天的开放领域对话生成,利用行为策略来管理人机交互流程,并结合强化学习方法对策略进行优化,从而在机器仿真和人机交互中获得了显著响应质量的提升。
- 不要迷失于否定:一种用于 Twitter 客服对话中的有效否定对话行为预测算法
本文提出了一种基于 SVM 的对话行为预测算法,应用于 Twitter 客户服务对话,其中否定处理是整个解决方案的组成部分。实验证明,对于类似于推特的非正式文本,基于启发式方法的方法更为有效。
- 我能帮助您吗?”:使用细粒度的对话行为模型 Twitter 客服对话
本研究提出了一种针对 Twitter 客服对话数据的的细粒度对话行为分类方法,并使用序列 SVM-HMM 模型在实时中预测不同行为类型,最终以数据驱动的方法预测客服对话数据的重要结果,包括客户满意度、客户沮丧和解决问题的整体情况。研究结果显 - ACL使用深度语法树和字符串的口语对话生成模型
本文提出一种基于序列到序列 (S2S) 方法的自然语言生成器,可以从输入的对话行为生成自然语言字符串和深度语法依存树,并将双步生成和单步生成进行了比较,结果表明单步生成表现更优秀。
- 对话行为建模用于自动标记与识别交谈语音
本文提出了一种基于统计学方法的对话行为建模方法,通过对词汇、语音、对话结构等多个方面的考虑对话行为进行检测和预测,并应用于语音识别和对话行为分类,实验表明取得了良好的对话行为分类精度和一定的语音识别效果提升。