BriefGPT.xyz
Ask
alpha
关键词
voice separation
搜索结果 - 3
IJCAI
将音乐声音分离视为关联预测问题:将一个音乐感知任务建模为多轨迹跟踪问题
这篇论文采用图神经网络,将声音分离问题建模为多轨迹跟踪问题,利用离散观察中的多音符信息实现对音乐的分解处理,使用新的正则化损失函数得到了最新的分离结果。
PDF
a year ago
ECCV
VoViT: 基于图论的低延迟音视频语音分离 Transformer
本文提出了一种音频 - 视觉声音分离方案,在两种不同场景(语音和唱歌)中实现了低时延的最新成果。该模型基于两级网络,采用轻量级图卷积网络从面部标记中提取运动线索,然后将视觉和音频特征输入到音频 - 视觉转换器中,为目标源的隔离估计提供相当不
→
PDF
2 years ago
视觉语音增强
本研究使用基于视听神经网络的视觉语音增强方法,在包含有目标演讲者语音的视频背景噪音情况下,通过口型运动提高演讲者语音的清晰度,在嘈杂的环境中实现了语音增强和噪音降低效果,相较于先前的视听方法在两个公共的口形读音数据集上表现更好,同时也是第一
→
PDF
7 years ago
Prev
Next