Oct, 2023

物体音视常识推理的解耦反事实学习

TL;DR我们提出了一种物理视听常识推理的解缚对抗学习方法 (DCL),旨在根据视频和音频输入推断物体的物理常识,并模拟人类的推理能力。我们的方法将视频解耦为静态和动态因素,并引入反事实学习模块来增强模型的推理能力。在实验中,我们展示了我们的方法改进了基线方法并取得了最先进的性能。