Apr, 2024

利用语音进行多模式通信中的手势检测

TL;DR通过使用 Transformer 编码器对语音和骨架序列进行交叉模态和早期融合技术,本研究在协同语音手势检测方面取得了显著的性能提升,并发现模型的手势预测置信度与与手势相关的语音频率特征存在相关性。