- 为什么不将聊天型大语言模型转换为非英语?
非英语大型语言模型(LLM)的稀缺性限制了其发展。将英语中心的 LLM 转化为非英语被认为是一种有效且资源高效的方法。我们介绍了一个名为 TransLLM 的简单框架,针对聊天型 LLM 转化问题提出了两个关键问题并给出解决方案。通过使用翻 - 模拟对话智能在聊天中的研究工作坊发现
本文总结了开放领域对话研究中的共享任务,重点关注人类智能模拟对话的模拟和推理。
- 地球是扁平的因为...:通过有说服力的对话调查 LLMs 对虚假信息的信念
大型语言模型容易受到外部错误信息的影响,特别是在多轮对话中发生信念变化的说服性对话中。本研究通过构建 Fact to Misinform 数据集,研究了大型语言模型对可回答正确的事实问题的说服性对话的敏感性,并发现它们的正确信念容易被各种说 - 交互式对话式头像生成
该研究提出了一种新的对话头生成基准,用于在面对面对话中合成单个交流者的行为,通过构建两个数据集,并针对面对面对话中的互动建立三个新任务,我们定义了相应的基线解决方案,并通过实验结果表明我们的基线方法可以生成具有响应能力和生动感的代理人,可以 - EMNLP半监督学习与粗细意图检测探索客户服务对话系统
本研究基于师生范式构建了一个弱监督数据集,整合粗细分类策略实现用户意图检测,实验表明,基于此方法的模块化对话系统能够以更高的成功率实现任务目标并生成更连贯的响应。
- EMNLP改进多轮情感支持对话生成的前瞻性策略规划
本文提出了一个使用多轮模式的情感支持会话系统 MultiESC,通过使用前瞻性启发式策略规划和用户状态建模来解决长期对话目标和用户情感的动态模态问题,实证结果表明 MultiESC 在对话生成和策略规划方面均明显优于竞争基线。
- 通过对比学习提高视觉对话中的跨模态理解
本文提出了基于 VD-BERT 模型的 ICMU 方法,通过四向对比学习区分不同的输入来提高跨模态理解,支持多次视觉对话,改善视觉对话模型的跨模态理解,并在 VisDial 数据集上得到了令人满意的结果。
- ACLC3KG: 一个中文常识对话知识图谱
本研究针对现有常识知识库的不足,提出了一种基于多轮对话语料库构建的中文常识对话知识图谱,该图谱包含社交常识知识和对话流信息,并开发了图谱 - 对话匹配方法,以此来评估信心图所具有的潜在能力。
- 对话式信息检索的神经网络方法
介绍了近年来发展的神经网络方法在对话式信息检索系统中的应用,并聚焦于自然语言处理,多轮对话,以及以人为中心的交互。
- AAAI基于图推理网络和定制化预训练的多轮对话应答选择模型
本文提出基于图推理网络(GRN)的多轮对话检索中的响应选择方法,并探究了其在序列推理和图推理方面的表现。在两个对话推理数据集上的实验表明,该模型可以显著优于强基准方法,并可以达到接近人类水平的性能。
- COLING对话式机器阅读理解:文献综述
本文综述了近期在对话机器理解方面最常见的趋势和方法,强调了处理对话历史的不同方法,并提供了一个综合框架,以指导未来对于 Conversational Machine Comprehension 的研究。
- 迈向类人开放领域聊天机器人
我们提出了 Meena,它是一个多轮开放域聊天机器人,在经过数据挖掘和过滤后进行端到端训练。我们提出了一种称为 Sensibleness 和 Specificity Average (SSA) 的人类评估度量,它捕捉了与人类一样的多轮对话的 - 无监督的上下文重写技术,用于开放领域对话
采用明确的语境重写方法,基于强化学习的上下文重写网络有助于候选检索,可解释的上下文建模以及在多轮会话中使用单轮框架。
- 基于检索的聊天机器人多轮响应选择的顺序匹配框架
我们提出了一种名为序列匹配框架(SMF)的新型匹配框架,该框架可以充分携带上下文中的重要信息,同时建模上下文中话语之间的关系,通过序列卷积网络和序列注意力网络实现,实验结果表明,这两种模型都可以显著优于现有技术,而可视化结果揭示了模型如何捕 - ACLSequential Matching Network: 基于检索的聊天机器人中多轮对话响应选择的新架构
使用顺序匹配网络(SMN)解决对话中响应选择的问题,该网络通过循环神经网络(RNN)建立了对辞话关系的建模并比现有工作取得更好的响应选择结果。