播客信息访问中的当前挑战和未来方向

SIGIRJun, 2021

播客信息访问中的当前挑战和未来方向

Current Challenges and Future Directions in Podcast Information Access

Rosie Jones, Hamed Zamani, Markus Schedl, Ching-Wei Chen, Sravana Reddy...

TL;DR本文探讨了播客与其他媒体的区别，挑战以及未来研究方向，并指出目前仍在由口碑主导的播客推荐需求。

Abstract

podcasts are spoken documents across a wide-range of genres and styles, with growing listenership across the world, and a rapidly lowering barrier to entry for both listeners and creators. The great strides in se

podcasts listenership recommendations word of mouth information access

发现论文，激发创造

NewsPod: 自动和交互式新闻播客

本文提出了一个利用最新的自然语言处理和语音合成技术进行自动生成的新闻播客应用，其中具有独特的交互性，通过用户询问问题并自动生成回答，以更好地模拟一种对话式的播客体验。经过两个可用性研究，该系统的设计被证明是可行和受喜爱的。

Feb, 2022

PodSumm -- 播客音频摘要

本文提出了一种方法来自动生成播客音频摘要，以帮助用户在投入时间聆听整个剧集之前快速预览内容，并使用一个自定义的数据集，并通过音频转文本转换以及文本摘要生成来实现。

Sep, 2020

播客中的语言使用建模及听众参与度分析

本文通过分析创作者的文字描述和音频稿件的文字转录，研究了语言风格与听众情感关系的各种因素，如词汇多样性、独特性、情感和句法等，并构建了不同的文本表示模型以显示出这些特点对听众情感反应的高度预测性，得出结论：流行的播客风格是有效的，但也有新的风格视角。

Jun, 2021

基于音乐收听和口味为冷启动用户推荐播客

研究使用用户的音乐消费行为来预测 Spotify 用户对超过 200,000 个播客的偏好，以解决推荐系统中的冷启动问题，并发现使用这种方法可以提高用户的媒体消费量。

Jul, 2020

基于播客短文本元数据的主题建模

本文研究了使用主题模型技术和命名实体来发现具有相关主题的播客。实验表明，使用我们提出的文档表示方法 NEiCE，可以提高主题的一致性，我们发布了实验代码以复现结果。

Jan, 2022

播客抽象摘要的基准分析

使用 Spotify Podcast 数据集对 Podcast 的 summarization 进行基础分析，以帮助研究者了解现有的预训练模型并构建更好的模型。

Aug, 2020

面向播客文稿的抽象化文本摘要

研究了基于抽象总结的方法，结合特定的语音片段进行全面的抽象总结，以解决口语转录中的表述问题，最终在大型播客数据集上证明了该方法的有效性。

Mar, 2022

开放领域播客剪辑自动化

研究了抽象化摘要的多个不同方面，如重要片段的选择、训练实例数量和质量的平衡，以及合适的摘要长度和起止点，其中从转录中选择重要部分作为输入是有优势的。同时使用神经网络建立的系统的最佳结果比创作者描述的有一个绝对提高达到了 0.268 (+21%) 的 NIST 评级的质量。

Nov, 2020

TREC 2020 Podcasts 赛道概述

本文介绍了 2020 年 Text Retrieval Conference (TREC) 的 Podcast Track，包括检索和摘要两个任务，提供了各个参与者的实验结果。此 Track 将在 2021 年 TREC 继续进行，略作修改以响应参与者的反馈意见。

Mar, 2021

检测播客中的无关内容

本研究提出一种旨在检测广告等信息的分类器，通过分析播客描述和音频文本的文本和听取模式，在播客节目摘要制作中有效地减少了额外生成的内容，从而实现了对播客节目的自动化摘要制作。

Mar, 2021