Aug, 2024

重新思考视频分割的掩蔽视频一致性:模型真的按预期学习了吗?

TL;DR本研究针对现有视频分割模型在处理小规模或类别不平衡数据集时产生的不一致性问题,提出了一种新的训练策略——掩蔽视频一致性(MVC)。该方法通过随机掩蔽图像片段,增强了时空特征的聚合能力,并引入对象掩蔽注意力(OMA)优化交叉注意力机制,显著提高了模型在多个数据集上的性能。