Apr, 2020
ViSQOL v3: 一种开源的、生产就绪的客观语音和音频指标
ViSQOL v3: An Open Source Production Ready Objective Speech and Audio Metric
Michael Chinen, Felicia S. C. Lim, Jan Skoglund, Nikita Gureev, Feargus O'Gorman...
TL;DR使用开源 C++ 库 ViSQOL 能够对音频和语音进行感知质量的评估,新版本相较于之前版本在设计和使用上均有改进,已获得 Google 内部团队的反馈并使用于生产环境,同时与真实数据进行了评估和基准测试,但仍存在一些限制和改进空间。