PodSumm -- 播客音频摘要

MMSep, 2020

PodSumm -- Podcast Audio Summarization

Aneesh Vartakavi, Amanmeet Garg

TL;DR本文提出了一种方法来自动生成播客音频摘要，以帮助用户在投入时间聆听整个剧集之前快速预览内容，并使用一个自定义的数据集，并通过音频转文本转换以及文本摘要生成来实现。

Abstract

The diverse nature, scale, and specificity of podcasts present a unique challenge to content discovery systems. Listeners often rely on text descriptions of episodes provided by the podcast creators to discover n

podcasts content discovery audio summaries text-domain dataset

发现论文，激发创造

开放领域播客剪辑自动化

研究了抽象化摘要的多个不同方面，如重要片段的选择、训练实例数量和质量的平衡，以及合适的摘要长度和起止点，其中从转录中选择重要部分作为输入是有优势的。同时使用神经网络建立的系统的最佳结果比创作者描述的有一个绝对提高达到了 0.268 (+21%) 的 NIST 评级的质量。

Nov, 2020

面向播客文稿的抽象化文本摘要

研究了基于抽象总结的方法，结合特定的语音片段进行全面的抽象总结，以解决口语转录中的表述问题，最终在大型播客数据集上证明了该方法的有效性。

Mar, 2022

播客抽象摘要的基准分析

使用 Spotify Podcast 数据集对 Podcast 的 summarization 进行基础分析，以帮助研究者了解现有的预训练模型并构建更好的模型。

Aug, 2020

播客摘要评估：一种评估摘要评估方法的资源

本文介绍了一种新的数据集，即播客摘要评估语料库，该数据集可用于评估长输入摘要，并提供数据选择功能以筛选参考摘要 - 文档对用作训练。

Aug, 2022

TREC 2020 播客摘要赛道的 CUED 语音

该研究介绍了用于 TREC 2020 播客摘要挑战的方法。该方法采用了两个步骤：过滤摘要中的冗余或信息较少的句子，然后应用基于 BART 的文本摘要系统。最好的结果在人类评估中达到了 1.777 的得分。

Dec, 2020

检测播客中的无关内容

本研究提出一种旨在检测广告等信息的分类器，通过分析播客描述和音频文本的文本和听取模式，在播客节目摘要制作中有效地减少了额外生成的内容，从而实现了对播客节目的自动化摘要制作。

Mar, 2021

基于播客短文本元数据的主题建模

本文研究了使用主题模型技术和命名实体来发现具有相关主题的播客。实验表明，使用我们提出的文档表示方法 NEiCE，可以提高主题的一致性，我们发布了实验代码以复现结果。

Jan, 2022

TalkSumm: 基于学术会议演讲的科学论文摘要数据集和可扩展标注方法

本文提出了一种利用科学会议上的演讲视频自动生成科技论文摘要的新方法，通过收集 1716 篇论文及其对应的视频，并创建了一个摘要数据集，最终模型在该数据集上的表现与手动摘要数据集上的模型相当，并通过人工专家验证了自动生成摘要的质量。

Jun, 2019

TREC 2020 Podcasts 赛道概述

本文介绍了 2020 年 Text Retrieval Conference (TREC) 的 Podcast Track，包括检索和摘要两个任务，提供了各个参与者的实验结果。此 Track 将在 2021 年 TREC 继续进行，略作修改以响应参与者的反馈意见。

Mar, 2021

Summaformers @ LaySumm 20, LongSumm 20

本文探讨了利用 Transformer-based 系统概括多领域科学研究论文的问题，并设计了两种不同类型的概述手段，即 LaySumm 和 LongSumm，使用 ROUGE 指标有效评估了本文系统的优越性。

Jan, 2021