BriefGPT.xyz
Ask
alpha
关键词
video action segmentation
搜索结果 - 3
预训练语言模型作为人类辅助的视觉规划器
本研究提出了『Visual Planning for Assistance (VPA)』的任务,通过视频中的行动段落和预测,使用预训练语言模型处理长时间的视频历史数据和复杂的行动依赖关系,从而使『multi-modal AI assista
→
PDF
a year ago
IJCAI
基于聚类视角的时间戳监督动作分割
本文从聚类的角度提出了一种框架来解决视频动作分割中矛盾间隙带来的错误伪标签问题,并引入了聚类损失函数,使得相同动作段内的帧特征更加紧凑,实验结果表明该方法有效。
PDF
2 years ago
ECCV
基于序列到序列翻译的融合全程和时间戳监督的暂态行动分割
本文提出了一个基于序列到序列解决视频动作分割的统一框架,利用全面时间戳监督设置的 seq2seq 翻译。我们使用 类似于映射视频帧序列到动作分段序列的方法,来解决动作分割这一问题。我们提出了一系列修改和辅助损失函数,以及针对标准 Trans
→
PDF
2 years ago
Prev
Next