Nov, 2023

语义听觉:利用双耳听觉装置编程声音场景

TL;DR语义听觉技术使得可穿戴设备能够实时聚焦或忽略具体声音,同时保留空间线索,通过神经网络实现在干扰声和背景噪音中提取双耳目标声音,并设计一种训练方法使系统能够推广到实际环境中,实验结果表明我们的系统能够处理 20 种声音类别,并在智能手机上以 6.56 毫秒的运行时间提供双耳输出,对于未知的室内和室外场景都能提取目标音频并保留空间线索。