关键词word error rate
搜索结果 - 94
  • 连接语音编码器和大型语言模型用于 ASR
    PDF9 months ago
  • FL4ASR 中优化器引起的平滑性的重要性:解密端到端 ASR 的联邦学习
    PDF9 months ago
  • Echotune:利用语音 ASR 任务中可变长度特性的模块化提取器
    PDF10 months ago
  • Convoifilter:一项关于进行鸡尾酒会话语音识别的案例研究
    PDF10 months ago
  • 使用 XLSR-53 的印尼语自动语音识别
    PDF10 months ago
  • 全球归一化模型的流式语音识别系统
    PDFa year ago
  • OxfordVGG 参加 EGO4D AV 转录挑战
    PDFa year ago
  • 离线文本识别的作者适应性:基于神经网络方法的探索
    PDFa year ago
  • 使用 GMM 进行语音分离与 ASR
    PDFa year ago
  • 用声学前瞻改进 RNN-Transducers
    PDFa year ago
  • 与目标对齐:利用通用即插即用框架优化 CTC 模型所需属性
    PDFa year ago
  • 基于大规模语言模型的长篇数据重打分
    PDFa year ago
  • DCTX-Conformer: 用于低延迟统一流和非流 Conformer 的动态上下文传递
    PDFa year ago
  • 自动语音识别中替代 CNN 前端的多视角频率 - 注意力算法
    PDFa year ago
  • ACL关于日语语音识别的宽松评估:建模自然发生的拼写不一致性
    PDFa year ago
  • 在转换器中使用统一的语音 - 文本表示进行仅限于文本的域自适应
    PDFa year ago
  • 流式混淆网络语音识别
    PDFa year ago
  • 利用 CLS 和语言标注来增强多语种 ASR 的 Tag-Team 方法
    PDFa year ago
  • 使用树形约束的指针生成器图神经网络进行上下文 ASR
    PDFa year ago
  • 将语音技术扩展至 1000 多种语言
    PDFa year ago