MUG: 通用会议理解和生成基准

Mar, 2023

MUG: A General Meeting Understanding and Generation Benchmark

Qinglin Zhang, Chong Deng, Jiaqing Liu, Hai Yu, Qian Chen...

TL;DR本研究旨在促进口语处理技术的发展，建立了一个大规模的 MUG 基准以对广泛的 SLP 任务的性能进行基准测试，包括主题细分、主题和会议层面的摘要和主题标题生成、关键短语提取和行动项检测。

Abstract

Listening to long video/audio recordings from video conferencing and online courses for acquiring information is extremely inefficient. Even after ASR systems transcribe recordings into long-form spoken language documents, reading ASR transcripts only partly speeds up seeking information. It has been observed that a range of NLP applications, such as

spoken language processing meeting understanding topic segmentation summarization keyphrase extraction

发现论文，激发创造

ICASSP 2023 年总会理解与生成挑战赛 (MUG) 概述

ICASSP2023 General Meeting Understanding and Generation Challenge (MUG) aims to improve users' efficiency in meetings by prompting research on spoken language processing, with five tracks including topic segmentation, summarization, title generation, keyphrase extraction, and action item detection. A large-scale meeting dataset, the AliMeeting4MUG Corpus, has been constructed and released to facilitate research.

Mar, 2023

面向源基数据生成的高效信息获取对话：以会议记录为案例

结合大型语言模型与人类专业知识，通过将角色扮演代理和用户的对话模拟为大型语言模型生成，然后由人类专家验证并补充归属数据，以更高效可靠地生成数据，并构建了集中在会议记录的首个信息检索对话数据集 MISeD，其中模型在测试集、手动 WOZ 测试集和现有基于查询的摘要基准上的优越性能表明我们方法的效用。

May, 2024

MUGEN: 视频 - 音频 - 文本多模态理解和生成的游乐场

本文介绍了通过引入音频和新的交互方式收集大量视频和相关音频的大型视频 - 音频 - 文本数据集 MUGEN，并展示了其在多模态理解和生成任务中的潜在应用。

Apr, 2022

多句压缩与预算次模最大化的无监督抽象会议摘要

我们提出了一种新颖的基于图形的框架，用于摘要会议演讲，完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点，同时解决了它们的弱点。此外，我们利用最近在 NLP 中应用的字嵌入和图形退化的进展，考虑外部语义知识，并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明，我们的系统改进了现有技术水平。代码和数据可公开获取，我们的系统可以交互式测试。

May, 2018

Game-MUG：多模态定向游戏情境理解与评论生成数据集

介绍 GAME-MUG，一个包含多模态游戏情境理解和观众参与评论生成数据集的新数据集，以及使用鲁棒性联合多模态双学习模型作为基线的新观众对话增强评论数据集。通过覆盖游戏情境和观众对话的学习，引入时间序列事件日志，检查模型对游戏情境 / 事件的理解能力和评论生成能力，展示多模态方面覆盖和联合集成学习方法的有效性。

Apr, 2024

MUG: 用户界面上的交互式多模态基础

针对多模态界面对话交互中的语言歧义问题，本文提出了一种新的交互式任务 MUG，并构建了一个包含 77820 组人类用户和智能 Agent 交互的实验数据集，通过离线和在线策略进行评估，实验结果表明允许迭代式交互可以显著提高任务完成率。

Sep, 2022

利用依存图融合进行抽象会议摘要

本文介绍了一种基于整数线性规划的句子融合方法，用于从多个发言中提取重要内容生成摘要，并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。

Sep, 2016

会议摘要的动态滑动窗口

本研究发现会议摘要的句子与会议议程有关，基于此提出了一种动态滑动窗口策略来解决长会议记录的自动文本摘要问题。实验结果表明，相较于传统模型，该方法获得了更高的文本一致性。

Aug, 2021

MeetingBank: 用于会议摘要的基准数据集

本文介绍了 MeetingBank—— 一个新的市政会议数据集，它采用了分治法来将会议摘要等任务分解为更小且可管理的任务。数据集包括会议视频链接、文本、摘要、议程等元数据，并公开发布以促进更好的 Meeting Summarization 技术的开发。

May, 2023

抽象会议总结：一项调查

本文对多方会议情境下的自动摘要这一任务涉及到的难点、数据集以及系统进行了综述，并介绍了未来的研究方向。

Aug, 2022