Jul, 2022

使用密集视频字幕和人物对象交互检测可疑活动的 SAVCHOI 系统

TL;DR提出了一种利用人 - 物交互模型来检测和总结监控视频中可疑活动的新方法,使用基于双模变换器中的视觉特征的方法修改了现有方法,并将其与现有的最先进的算法进行了比较,发现该方法在密集字幕表现方面优于其他方法,并最终使用遗传算法找出不同 NMS 阈值条件下的最佳性能。