Aug, 2024

基于语言驱动的互动阴影检测

TL;DR本研究解决了传统阴影检测方法在动态视频场景中无法精确检测特定阴影区域的问题。提出了一种创新的Referring Video Shadow Detection (RVSD)任务,通过自然语言提示实现对阴影的灵活分割和用户交互,开辟了视频编辑和虚拟现实等广泛应用的可能。实验结果表明,所提出的Referring Shadow-Track Memory Network (RSM-Net)在这一任务上达到了最先进的性能。