Jul, 2024

基于方差驱动的复杂人类活动识别框架与生成式表示

TL;DR在智能环境中,复杂人类活动识别(CHAR)是一个关键挑战,现有研究通常需要对原子和复杂活动进行细致标记,这是一项劳动密集型的任务,由于可用数据集的稀缺性和不准确性,容易出现错误。为了应对这一问题,我们引入了一种名为VCHAR(基于方差的复杂人类活动识别)的新框架,将原子活动的输出视为指定时间间隔上的分布。利用生成方法,VCHAR通过基于视频的解释向用户阐明复杂活动分类的推理过程,用户无需具备先验的机器学习专业知识即可理解。在三个公开可用的数据集上的评估结果表明,VCHAR提高了复杂活动识别的准确性,而无需精确的时间或顺序标记原子活动。此外,用户研究证实VCHAR的解释比现有方法更易理解,有助于非专业人士更广泛地理解复杂活动识别。