Feb, 2022

ICASSP 2022 多通道多方会议转录挑战赛的 Royalflush 演讲者分离系统

TL;DR该研究提出将多通道和 U 型网络模型相结合,利用并行和远场声学的优势,在说话人识别系统中实现远场重叠语音检测,并探索了三种说话人嵌入方法,最终取得了最佳性能。