Nov, 2022

无监督基于不确定性的语音伪标签过滤和模型校准

TL;DR本文介绍了一种基于 Dropout 的不确定性驱动自训练(DUST)方法,该方法使用教师模型对未标记目标域数据提供伪标签。我们提出了一种基于模型预测的不确定性的简单,有效和理论上可靠的 PL 过滤策略,并指出 PL 过滤可能会在严重的源域和目标域不匹配的情况下失败。此外,我们还将神经网络模型校准的研究成果带到了 DUST 中,并发现模型校准与 DUST PL 过滤步骤的积极结果强相关。