MADNet：基于最大化受话方推断期望的多方会话生成

May, 2023

MADNet：基于最大化受话方推断期望的多方会话生成

MADNet: Maximizing Addressee Deduction Expectation for Multi-Party Conversation Generation

Jia-Chen Gu, Chao-Hong Tan, Caiyuan Chu, Zhen-Hua Ling, Chongyang Tao...

TL;DR提出了一种预期最大增价网络（MADNet），用于建模具有缺失代表标签的多方对话，实现全连接图的生成并优化了生成应答的质量。

Abstract

Modeling multi-party conversations (MPCs) with graph neural networks has been proven effective at capturing complicated and graphical information flows. However, existing methods rely heavily on the necessary

multi-party conversations graph neural networks addressee labels mpc generation scarcity

发现论文，激发创造

HeterMPC：一种用于多方对话中回应生成的异构图神经网络

提出了一种基于异构图神经网络的多方会话响应生成模型，通过建模话语和交互者的语义信息及设计不同类型的元关系来处理多方对话中的结构信息，实验证明其在 Ubuntu Internet Relay Chat（IRC）通道基准测试上优于其他基线模型。

Mar, 2022

多方对话应答生成的 EM 预训练

此篇论文提出了一种基于 EM（期望最大化）算法的方法，用于优化多方对话应答生成模型，解决多方对话数据中缺乏标注指定对话对象的标签的问题。

May, 2023

GIFT: 基于图的多方会话理解 Fine-Tuning

通过设计四种边将图诱导信号引入注意力机制，我们提出了一种名为图诱导微调 (GIFT) 的轻量级方法，可用于多方对话的普适性理解。通过将其应用到三个预训练的语言模型中，我们发现 GIFT 可以在三项下游任务中显着提高模型性能，仅每层编码增加 4 个参数，在多方对话理解领域实现了最新的最佳性能。

May, 2023

DADgraph: 面向多方对话机器阅读理解的话语感知对话图神经网络

提出一种考虑复杂的多方对话话语结构的对话图神经网络模型 DADgraph，并在包含话语结构注释的大规模 MRC 数据集 Molweni 上进行实验验证，实验表明该模型相较于强基线模型在 Molweni 数据集上具有统计学显著的改进。

Apr, 2021

ChatGPT 是否是一个良好的多方对话解决器？

利用 ChatGPT 和 GPT-4 等生成型大型语言模型对多方对话进行评估与分析，揭示了利用生成型大型语言模型处理多方对话所面临的挑战以及可行的解决方案。

Oct, 2023

用于文档理解的消息传递注意力网络

该文介绍了一种基于消息传递框架的应用，即面向自然语言处理的消息传递注意力网络（MPAD），并在 10 个标准文本分类数据集上进行了实验，结果表明其性能与现有最先进模型相当，代码公开可用。

Aug, 2019

多方响应生成与关系解缠

该研究提出了一种通过对话上下文进行关系推理来指导神经响应生成的方法，并在多方对话中展示出优于基线模型的效果。

Mar, 2024

MPC-BERT: 用于多方会话理解的预训练语言模型

MPC-BERT 是一种预训练的神经模型，通过学习谁对谁说什么，结合几个自监督任务，在多方对话任务中表现出比以前的方法更好的性能。

Jun, 2021

多方目标跟踪与 LLMs：预训练、微调和提示工程比较

通过对大规模语言模型在任务导向的多方对话中捕捉能力的评估，本研究记录并转录了医院中患者、他们的陪伴者和社交机器人之间的 29 个多方对话，并对此语料库进行了多方目标跟踪和意图 - 插槽识别的注释。我们在零样本和少样本设置中比较了三种方法，即微调 T5，使用 LED 创建预训练任务以训练 DialogLM，并采用 GPT-3.5-turbo 的提示工程技术，以确定哪种方法可以用有限数据完成这一新任务。在少样本设置中，GPT-3.5-turbo 显著优于其他方法。当给出例子注释对话中 7% 的语料库时，“推理” 风格的提示是效果最好的方法。它正确注释了 62.32% 的目标跟踪多方对话和 69.57% 的意图 - 插槽识别多方对话。而 “故事” 风格的提示会增加模型的虚构成分，在安全关键环境中可能会有不利影响。我们得出结论，多方对话仍然对最先进的大规模语言模型构成挑战。

Aug, 2023

自适应消息传递的二分图网络用于无偏场景图生成

通过引入自适应消息传递的置信度感知双分图神经网络和高效的双层数据重新采样策略，可以有效地消除偏差，进而实现对场景图生成的均衡处理。该方法在多个具有挑战性的数据集上实现了卓越或具有竞争力的性能，包括 Visual Genome，Open Images V4/V6。

Apr, 2021