BriefGPT.xyz
Ask
alpha
关键词
temporal semantics
搜索结果 - 2
ICCV
声音的力量:稳定扩散下的音频反应视频生成
通过使用包含变化的时间语义和大小的音频输入的 The Power of Sound (TPoS) 模型结合文本语义信息和经过预训练的音频编码器的顺序音频嵌入,TPoS 方法能够生成对音频有反应的视频内容,并在各个任务中展示了其有效性,与当前
→
PDF
10 months ago
ICCV
预测未来:联合学习模型用于行动预测
本篇论文提出了一种行动预测模型,受人类神经结构的启发,在预测未来视觉和时间表现方面,能够预测合理的未来行动,并证明使用视觉和时间语义的场景表示结合递归生成对抗网络 (GAN) 框架可以实现未来表现的表示综合,该模型在多个数据集上优于当前最先
→
PDF
5 years ago
Prev
Next