DDLSTM:用于跨数据集行为识别的双域 LSTM
本文主要介绍了基于卷积神经网络和 LSTM 神经网络的动作识别方法,实验证明本文提出的多流融合模型可以有效地提高识别准确率。
Apr, 2017
L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。
Aug, 2017
本论文提出了一种基于时空协同注意机制的临域动作识别框架 TCoN,通过特征匹配解决了跨域动作识别的问题,实验结果表明该框架在跨域设置下显著提高了识别准确率。
Dec, 2019
提出了一种基于双学习机制的跨领域用户行为建模方法,为两个相关领域建立双重的潜在嵌入,实现了在两个目标域上同时提高 CTR 预测性能的目标,实验证明了比其他最先进的模型表现更好的效率和性能。
Jun, 2021
本文介绍一种基于 CoDT 模型的在线聚类算法来应对跨域三维动作识别问题,该算法利用了源域和目标域之间的标签数据及未标签数据,并提出了一种协同聚类策略来保证特征聚集性和伪标签的生成。
Jul, 2022
提出了一种新颖的跨领域少样本视频动作识别方法,利用自监督学习和课程学习平衡源领域和目标领域的信息以解决多样性之间的挑战。在几个具有挑战性的基准数据集上评估并展示了该方法优于现有的跨领域少样本学习技术。
Sep, 2023
本文提出了一种基于领域自适应的行为识别方法,使用对抗学习在跨域场景中学习跨域动作识别,从而实现对低光条件下的人类行为进行识别,并在 InFAR 和 XD145 动作数据集上取得了 SOTA 表现。
Oct, 2022
本文介绍了一种新的视频预测模型 ——MS-LSTM,该模型采用多尺度空间和时间结构,在充分捕捉时空上下文信息方面具有高效和优秀的性能。与现有的 RNN 模型不同的是,MS-LSTM 使用 LSTMs 和不同的卷积内核设计空间和时间尺度,实现多尺度表示,有效减少了训练成本,同时取得更好的表现。
Apr, 2023
本文研究了一种弱监督目标检测框架,通过使用视频和动作描述作为监督信号,并提出了一种基于时间动态图长短期记忆网络的新方法来解决视频中缺失标签等问题,并在 Charades 数据集上进行了广泛的评估,证明了该方法的优越性。
Aug, 2017