DDLSTM：用于跨数据集行为识别的双域 LSTM

CVPRApr, 2019

DDLSTM：用于跨数据集行为识别的双域 LSTM

DDLSTM: Dual-Domain LSTM for Cross-Dataset Action Recognition

Toby Perrett, Dima Damen

TL;DR本文提出了一种名为双域 LSTM（DDLSTM）的神经网络结构，通过交叉污染批量归一化方法，旨在解决卷积网络和循环神经网络在领域对齐中存在的问题，在多个数据集上进行了帧级行为识别的实验，结果表明 DDLSTM 优于标准、微调、批量规范化的 LSTM。

Abstract

domain alignment in convolutional networks aims to learn the degree of layer-specific feature alignment beneficial to the joint learning of source and target datasets. While increasingly popular in →

domain alignment convolutional networks recurrent networks dual-domain lstm temporal dependencies

发现论文，激发创造

Two Stream LSTM：人类动作识别的深度融合框架

本文主要介绍了基于卷积神经网络和 LSTM 神经网络的动作识别方法，实验证明本文提出的多流融合模型可以有效地提高识别准确率。

Apr, 2017

基于格子长短期记忆的人类动作识别

L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法，结合多模态训练程序，在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。

Aug, 2017

差分循环神经网络用于动作识别

本文提出了一种差分门控 LSTM 神经网络，它采用导数来量化关键运动模式对时间序列数据的信息增益，从而提高动作识别的准确率。

Apr, 2015

对抗性跨域行为识别及协同注意力

本论文提出了一种基于时空协同注意机制的临域动作识别框架 TCoN，通过特征匹配解决了跨域动作识别的问题，实验结果表明该框架在跨域设置下显著提高了识别准确率。

Dec, 2019

跨域点击率预测的双重注意力序列学习

提出了一种基于双学习机制的跨领域用户行为建模方法，为两个相关领域建立双重的潜在嵌入，实现了在两个目标域上同时提高 CTR 预测性能的目标，实验证明了比其他最先进的模型表现更好的效率和性能。

Jun, 2021

跨域三维动作识别的领域共享和目标特定特征聚类

本文介绍一种基于 CoDT 模型的在线聚类算法来应对跨域三维动作识别问题，该算法利用了源域和目标域之间的标签数据及未标签数据，并提出了一种协同聚类策略来保证特征聚集性和伪标签的生成。

Jul, 2022

跨领域少样本学习视频的 CDFSL-V 模型

提出了一种新颖的跨领域少样本视频动作识别方法，利用自监督学习和课程学习平衡源领域和目标领域的信息以解决多样性之间的挑战。在几个具有挑战性的基准数据集上评估并展示了该方法优于现有的跨领域少样本学习技术。

Sep, 2023

环境对抗域自适应动作识别

本文提出了一种基于领域自适应的行为识别方法，使用对抗学习在跨域场景中学习跨域动作识别，从而实现对低光条件下的人类行为进行识别，并在 InFAR 和 XD145 动作数据集上取得了 SOTA 表现。

Oct, 2022

MS-LSTM: 探索视频预测领域的时空多尺度表示

本文介绍了一种新的视频预测模型 ——MS-LSTM，该模型采用多尺度空间和时间结构，在充分捕捉时空上下文信息方面具有高效和优秀的性能。与现有的 RNN 模型不同的是，MS-LSTM 使用 LSTMs 和不同的卷积内核设计空间和时间尺度，实现多尺度表示，有效减少了训练成本，同时取得更好的表现。

Apr, 2023

基于动作驱动的视频目标检测的时间动态图 LSTM

本文研究了一种弱监督目标检测框架，通过使用视频和动作描述作为监督信号，并提出了一种基于时间动态图长短期记忆网络的新方法来解决视频中缺失标签等问题，并在 Charades 数据集上进行了广泛的评估，证明了该方法的优越性。

Aug, 2017