BriefGPT.xyz
大模型
Ask
alpha
关键词
video-based learning
搜索结果 - 3
Vid2Robot: 基于跨引注意力变形器的端到端视频条件策略学习
通过观察人类行为并将其翻译成可执行的动作,本研究介绍了一种基于视频学习的机器人框架 Vid2Robot,它通过训练机器人模型利用人类视频和机器人轨迹数据集进行任务执行。该模型利用交叉注意力机制将提示视频特征融合到机器人的当前状态中,并生成能
→
PDF
3 months ago
CVPR
LipSync3D:使用姿态和光照规范化从视频中高效学习个性化的三维说话脸
本文提出了一种基于视频学习的框架,用于从音频中制作个性化的 3D 说话人脸,其中使用面部标准化和自回归方法来提高样本效率并生成高保真的口型同步视频。
PDF
3 years ago
视频表示学习的自监督时序判别学习
本研究提出一种新的基于视频的自监督学习框架 VTDL,通过增加时间三元组数据的容量来增强时间特征表示的能力,并使用 Temporal Consistent Augmentation(TCA)设计器进行时间信息测量。该方法在动作识别任务中具有
→
PDF
4 years ago
Prev
Next