BriefGPT.xyz
Ask
alpha
关键词
multi-modal enrollments
搜索结果 - 1
MM-KWS: 多模态用户定义多语言关键词检测
提出了 MM-KWS,一种新颖的用户定义关键词识别方法,利用文本和语音模板的多模态注册。通过从文本和语音中提取音素、文本和语音嵌入,将这些嵌入与查询语音嵌入进行比较,以检测目标关键词。为了确保 MM-KWS 在多种语言环境下的适用性,利用了
→
PDF
25 days ago
Prev
Next