May, 2021

多模态视频人体聚类:面部、身体、声音

TL;DR本文针对视频中的角色聚类进行多模态高精度聚类算法和视频角色聚类数据集的引入,旨在解决当前的人脸聚类局限性,为角色层次的推理提供更多线索,并在所有现有数据集上取得了新的最新成果。