Nov, 2023

LIP-RTVE:西班牙连续口语的音视数据库

TL;DR本文介绍了一个半自动注释的音视频数据库,用于处理自由自然的西班牙语,提供了来自西班牙电视的 13 小时数据。此外,报告了基于隐马尔可夫模型的发言人相关和发言人无关情景的基准结果,这是一种在语音技术领域广泛使用的传统范式。