MMAug, 2023

多方面响应式听力头生成的 MFR-Net:通过去噪扩散模型

TL;DR响应式听觉头部生成网络(MFR-Net)旨在通过生成侦听视频来模拟面对面通信情境,以姿态和观点表达对发言人作出响应,同时保持交互模式的多样性和侦听者身份信息的准确性。