KDDSep, 2018

在播客中识别电影实体

TL;DR本文提出了一种名词实体识别系统,旨在识别播客音频中的电影标题。我们实施了一个两阶段的方法,结合模糊匹配和对电影特定元数据敏感的线性模型,来解决计算机转录错误的问题,并且不需要显著的计算开销。在多样化的播客集上进行评估,当结合模糊匹配和线性模型时,在三个基准方法上 F1 分数增加了 20% 以上。