Apr, 2024

神经符号化视频问答:为现实世界视频问答学习组合的时空推理

TL;DR该研究提出了一种针对实际视频问答任务的神经符号框架(NS-VideoQA),通过引入场景解析网络(SPN)和符号推理机(SRM),实现了对复合时空问题的高效推理和回答能力的提升。