- 基于对齐的概率事件一致性检查
本文介绍了一种基于概率事件日志的对齐式符合性检查算法,使用传感器、物联网技术、统计学和人工智能等现代监测和活动识别技术来产生事件数据,并通过自定义阈值参数控制事件数据与过程模型的信任水平,展示该算法在理论例子中的功能,从而减少假阳性偏差。
- 通过条件生成对抗网络提高基于传感器的动物行为分类性能
本研究通过采用改进后的 U-Net 架构和条件生成对抗网络(CGAN)将分类模型扩展到更多时间点判断,提高活动识别的性能,对包括奶牛、猪在内的数据集进行了测试,并显示出明显的改进。
- ECCVModSelect: 为合成与真实域通用化自动选择模态
本研究提出了一种无监督模态选择方法,即 ModSelect,通过计算多模态分类器的预测之间的相关性和其嵌入的域差异,从而系统地计算模态选择阈值,选择只具有高相关性和低域差异的模态,从而达到选择正向贡献模态的目的,并在合成到真实领域自适应基准 - 我的驾驶员观察模型是否过于自信?输入引导的校准网络用于可靠和可解释的置信度估计
本研究首次探究现代驾驶员观察模型的置信度值与正确结果概率之间的匹配程度,并提出了增强置信度校准的两种策略,分别是温度缩放和带输入引导的校准行为识别模型(CARING),实验结果显示 CARING 模型性能最佳,能够显著提高模型置信度的质量和 - CVPR跨视频领域的音频自适应活动识别
本研究提出了一种基于音频自适应编码器和相关学习方法的活动识别方法,通过处理活动声音进行域自适应,进而解决活动出现场景或视角变化等域漂移问题。实验证明该方法在多个数据集上均有良好表现。
- IJCAI变分推断下的小样本活动识别
我们提出了一种新的变分推断架构(HF-AR)用于少样本活动识别,在三个广泛使用的数据集上展示了在 1-shot 和 5-shot 分类上优于最先进技术的表现。
- CVPR时空动作定位的关系建模
本文提出一种用于动作识别的多类型关系建模方法,并采用训练策略将多种关系建模集成到两个大规模视频数据集的端对端训练中去。同时,结合记忆库的学习和面向长尾数据分布的微调方法,以进一步提高性能,最终在 AVA-Kinetics 测试集中实现了 4 - CVPREgo-Exo:将第三人称视频的视觉表示转移到第一人称视频
本文提出使用大规模第三人称视频数据集进行预训练的以自我为中心的视频模型方法,通过在第三人称视频中发现预测自我特定属性的潜在信号,并将其作为知识蒸馏损失融入模型预训练中,在精细调节进行自我中心的活动识别时表现出最佳表现,取得 Charades - MM在线学习概率事实演算理论在答案集编程中的应用
介绍了一种基于 ASP 的、能够通过权重规则进行概率推理的复杂事件识别系统,可应用于活动识别等领域,并与多种现有算法进行了比较,并证明了其在效率和预测性能方面的优越性。
- 司机活动识别的粗糙时间关注网络 (CTA-Net)
提出了一种名为 Coarse Temporal Attention Network(CTA-Net)的模型来识别驾驶员的活动,该模型利用了时空注意力来建模细微变化,并使用注意机制来生成用于活动识别的高级动作特定背景信息。
- ECCVAssembleNet++: 基于注意力连接组合模态表征
使用视频模型 AssembleNet++,并结合 peer-attention 和神经元连接等技术,能够更好地学习对象信息和外观动态特征,并在活动识别领域取得新的最高水平。
- ECCV面向行动识别的定向时态建模
本文引入了通道独立方向卷积(CIDC)操作,学习在局部特征之间建模时间演变,构建了一个轻量级网路建立并能分析多个空间尺度上剪辑级时序演变的网络结构,并通过四个流行的活动识别数据集验证了该方法的有效性,并可视化该网络的激活图,显示其能够关注图 - ECCV面向弱监督时序活动定位的对抗感知背景损失
本文提出了一种新的基于弱监督学习的时间活动定位方法 A2CL-PT,通过使用两个三元组来学习每个活动类别的区分特征和每个视频中活动相关特征与背景特征的区分特征,以此增强识别无活动发生时的性能并提高精度,实验证明该方法有效,特别是在 THUM - AAAIHAPRec: 混合式活动与计划识别
通过混合使用动作识别模块和目标识别算法,本文实现了室内环境下的活动识别,以确定视频主体追求的最终目标。
- AAAIDASZL: 零样本学习的动态动作签名
本文介绍了一种以动态行为标记的组合作为活动模型的精细识别方法,实现零样本活动识别,其中利用深度学习组件支持简单的一级状态机,此方法在多个实验范例下建立了新的业界标准,并扩展到视频零样本联合分割和分类的唯一框架,同时展示了无需额外训练即可在完 - AAAI自然语言时序相邻网络学习用于时刻定位
本文提出了一个基于 2D 时间映射的 Temporal Adjacent Network(2D-TAN)框架,用于在未修剪的视频中匹配与查询句子相关的特定时间点,该框架可以编码相邻的时间关系,并学习具有区分性的特征以提高活动识别的准确性,通 - 传感器数据隐私和效用保护转换
为了减轻从可穿戴设备或便携设备共享原始传感器数据到云辅助应用程序时可能遇到的隐私威胁,我们提出了在数据共享之前对传感器数据进行转换的机制,旨在通过消除可用于用户重新识别或推断敏感活动的模式,同时引入目标应用程序(或任务)的轻微效用损失来实现 - 活动识别的时间推理图
本文提出了一种高效的时间推理图 (TRG), 用于同时捕捉视频序列之间的外观特征和时间关系。通过构建可学习的时间关系图来探索多尺度范围上的时间关系。在多头时间邻接矩阵的帮助下,提出了一个多头时间关系聚合器来提取那些通过图卷积计算的特征的语义 - KDD野生动物团体行为识别框架
本研究提出了一种基于序列分析方法对野生动物数据进行行为注释,特别是对社会群体的集体行为进行分类的方法,并在真实数据集上进行了评估,显示出相比基线方法显著的准确度提高。
- IJCAI多智能体注意力活动识别
通过多智能体空间时间关注模型,智能选择观测到的信息和关联的运动方式来完成并优化活动识别任务。在四种真实世界数据集上的实验结果表明,该模型优于现有的方法。