BriefGPT.xyz
Ask
alpha
关键词
speaker diarisation
搜索结果 - 3
高分辨率说话人分离嵌入提取器
本文提出了一种新的嵌入提取器体系结构,称为高分辨率嵌入提取器(HEE),它从每个语音片段中提取多个高分辨率嵌入,每个密集的帧级嵌入可以代表一个说话者,多个说话者可以由每个段的不同帧级特征表示。通过在五个评估集上的实验,表明了所提出的 HEE
→
PDF
2 years ago
寻找适用于说话人分离的强嵌入提取器
通过生成更贴近对话场景的说话人验证评估协议和两种数据增强技术来解决说话人嵌入提取器在多说话人存在时的性能下降问题,实验证明这两种方法都是有效的。
PDF
2 years ago
野外演讲者日志检测
本研究旨在使用自动化音频视觉分离方法对 YouTube 视频进行说话者分割。研究将自己设计的说话者模型运用于半自动数据集创建流程中,从而显著减少注释视频所需的时间。通过这种方式,研究人员成功地发布了一个名为 VoxConverse 的大规模
→
PDF
4 years ago
Prev
Next