May, 2023

ViDaS 视频深度感知显著性网络

TL;DR本文介绍了一种称为 ViDaS 的全卷积双流深度感知显著性网络,使用 RGB 和深度流作为输入,利用编码器 - 解码器模型获得显著性图来预测人类在 “野外” 环境中的注意力,经过在多个不同数据库中的测试和评估,该方法在大多数情况下优于现有的模型以及我们的仅使用 RGB 的变型,适用于预测普遍的注意力问题,是第一种结合 RGB 和深度特征来解决 “野外” 感兴趣目标估计问题的深度学习视频显著性评估方法,其代码将公开发布。