Jun, 2024

ASoBO:会议中远程说话者分辨的注意力波束选择

TL;DR基于自注意力的算法用于选择固定空间滤波器的输出,从而用于联合语音活动检测和重叠说话检测的特征提取器,进而推断说话人分离。自注意力权重的分析表明其可解释性,因为它们与说话者的角度位置相关。