Feb, 2024

精确安全交易的数字微模型

TL;DR我们的研究致力于创建数字识别的微型模型,以处理反映现实世界发音模式的不同讲话样式,并且相较于商业或开源的 ASR 系统,我们的微型模型在识别数字方面减少了错误率(我们最佳微型模型的错误率为 1.8%,而 Whisper 错误率为 5.8%),而且占用的内存空间较低(我们的模型为 0.66 GB VRAM,而 Whisper 为 11 GB VRAM)。