BriefGPT.xyz
Ask
alpha
关键词
meerkat
搜索结果 - 3
ECCV
Meerkat: 音视大型语言模型在时空中的基线
Meerkat 是一个具有对图像和音频进行空间和时间精细理解的音频 - 视觉 LLM 模型,通过优化传输和交叉注意模块,能够处理诸如音频引用图像定位、图像引导音频时间定位和音频 - 视觉事实核查等挑战性任务,在包含 300 万数据样本的 A
→
PDF
9 days ago
CVPR
猫鼬行为识别数据集
引入一个大型、多样化的浣熊行为识别视频数据集,包括群体社交互动、相机视野内个体的跟踪、不同光照条件等,共包括来自新西兰惠灵顿动物园的 20 个视频和 15 个未注释的视频,共计 848,400 个已注释帧。
PDF
a year ago
大规模射电干涉数据的有损压缩
提出了一种基于基线相关的有损压缩技术,可以将能见度数据进行压缩,并且利用矩阵秩的关系以及低秩逼近的方法来描述原始数据,并将其表示为基线数据矩阵的集合,其中每个基本分量分别对应于天空分布的特定傅里叶分量。该方法可以有效压缩数据并且在空间分辨率
→
PDF
a year ago
Prev
Next