Jul, 2024

智能语音分离、识别与合成性能与效率评估研究

TL;DRMamba和transformers在多个语音相关任务中的性能和效率需要进行比较,研究中通过对三个任务分别使用Mamba-TasNet、ConMamba和VALL-M三种模型并与相似大小的transformers进行比较,发现Mamba的性能在某些情况下可以媲美或超过transformers,且对于超过阈值时长的语音具有更高的内存和速度效率,但在短于阈值时长、需要同时建模文本和语音的模型中表现较差。