Mar, 2025

COMODO:用于高效自我中心人类活动识别的跨模态视频到IMU的蒸馏

TL;DR本研究解决了自我中心视频模型在持续设备识别中的高功耗和隐私问题,提出了COMODO,一个跨模态自监督蒸馏框架,通过无标注数据从视频向IMU传递丰富的语义知识。实验表明,COMODO显著提升了人类活动分类的性能,并展现出强大的跨数据集泛化能力,为未来研究提供了广阔的应用前景。