MUG: 通用会议理解和生成基准
ICASSP2023 General Meeting Understanding and Generation Challenge (MUG) aims to improve users' efficiency in meetings by prompting research on spoken language processing, with five tracks including topic segmentation, summarization, title generation, keyphrase extraction, and action item detection. A large-scale meeting dataset, the AliMeeting4MUG Corpus, has been constructed and released to facilitate research.
Mar, 2023
结合大型语言模型与人类专业知识,通过将角色扮演代理和用户的对话模拟为大型语言模型生成,然后由人类专家验证并补充归属数据,以更高效可靠地生成数据,并构建了集中在会议记录的首个信息检索对话数据集 MISeD,其中模型在测试集、手动 WOZ 测试集和现有基于查询的摘要基准上的优越性能表明我们方法的效用。
May, 2024
本文介绍了通过引入音频和新的交互方式收集大量视频和相关音频的大型视频 - 音频 - 文本数据集 MUGEN,并展示了其在多模态理解和生成任务中的潜在应用。
Apr, 2022
我们提出了一种新颖的基于图形的框架,用于摘要会议演讲,完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点,同时解决了它们的弱点。此外,我们利用最近在 NLP 中应用的字嵌入和图形退化的进展,考虑外部语义知识,并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明,我们的系统改进了现有技术水平。代码和数据可公开获取,我们的系统可以交互式测试。
May, 2018
介绍 GAME-MUG,一个包含多模态游戏情境理解和观众参与评论生成数据集的新数据集,以及使用鲁棒性联合多模态双学习模型作为基线的新观众对话增强评论数据集。通过覆盖游戏情境和观众对话的学习,引入时间序列事件日志,检查模型对游戏情境 / 事件的理解能力和评论生成能力,展示多模态方面覆盖和联合集成学习方法的有效性。
Apr, 2024
针对多模态界面对话交互中的语言歧义问题,本文提出了一种新的交互式任务 MUG,并构建了一个包含 77820 组人类用户和智能 Agent 交互的实验数据集,通过离线和在线策略进行评估,实验结果表明允许迭代式交互可以显著提高任务完成率。
Sep, 2022
本文介绍了一种基于整数线性规划的句子融合方法,用于从多个发言中提取重要内容生成摘要,并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。
Sep, 2016
本研究发现会议摘要的句子与会议议程有关,基于此提出了一种动态滑动窗口策略来解决长会议记录的自动文本摘要问题。实验结果表明,相较于传统模型,该方法获得了更高的文本一致性。
Aug, 2021
本文介绍了 MeetingBank—— 一个新的市政会议数据集,它采用了分治法来将会议摘要等任务分解为更小且可管理的任务。数据集包括会议视频链接、文本、摘要、议程等元数据,并公开发布以促进更好的 Meeting Summarization 技术的开发。
May, 2023