BriefGPT.xyz
大模型
Ask
alpha
关键词
video semantics
搜索结果 - 3
VideoQA-SC:用于视频问答的自适应语义交流
本文提出了一种面向视频问答任务的端到端语义通信系统 VideoQA-SC,通过有效的视频语义提取和高效稳健的语义传输,绕过接收端的视频重构,实现了在嘈杂或衰落无线信道上直接完成视频问答任务,并实验证明在广泛的信道条件和带宽限制下,Video
→
PDF
2 months ago
ICCV
Prompt Switch: 高效的 CLIP 适应文本 - 视频检索
该研究论文介绍了一种在文本 - 视频检索中学习视频语义表示的方法,通过将一个空间 - 时间上下文模块引入图像编码器,并通过辅助视频字幕目标进行训练,以提高视频帧的语义能力。在增强后的帧表示上使用简单的时序融合策略,取得了三个基准数据集(MS
→
PDF
a year ago
LASER:语义视频表示的神经符号学习
本研究提出了一种基于逻辑规格说明的神经符号方法 LASER,通过其可有效地训练低级感知模型以提取符合所需高级规格说明的细粒度视频表示,不仅可以学习细粒度的视频语义,而且还可以优于现有基准在下游任务中表现得更好。
PDF
a year ago
Prev
Next