Jan, 2023

LoCoNet:长短时序上下文网络用于活跃说话人检测

TL;DR该研究提出了一种名为 LoCoNet 的模型,包含长期内讲话者历史和短期内各个讲话者之间的交互信息,使用自注意力机制和卷积块分别建模两种信息,并在多个数据集上取得了最先进的表现。