BriefGPT.xyz
Ask
alpha
关键词
audio manipulation
搜索结果 - 2
CPU 上的低延迟实时语音转换
我们将之前的音频处理和生成神经网络的结构应用于实时的多对一声音转换任务中,得到了具有低延迟和低资源使用的模型 LLVC(低延迟低资源声音转换),在 16kHz 比特率下延迟不到 20 毫秒,在消费级 CPU 上运行速度接近实时的 2.8 倍
→
PDF
8 months ago
TranssionADD: 基于多帧强化学习的序列标注模型用于音频深度伪造检测
本研究提出了一种 TranssionADD 系统,通过序列标签任务和 MFD 模块结合多种数据增强技术改进模型能力,使用 IFP 损失函数和处理 segment 异常值,有效解决了检测深度伪造语音 utterance 的难题。
PDF
a year ago
Prev
Next