Mar, 2024

REWIND 数据集:在野外多模态肢体运动信号中进行隐私保护的说话状态分割

TL;DR从视频、身体加速度以及身体姿态跟踪三方面预测由音频提取的 20Hz 二进制说话状态信号,为说话状态检测方法的广泛评估提供了必需的信号和基准。