关键词visual features
搜索结果 - 120
- Whisper-Flamingo: 集成视觉特征于 Whisper 中用于音频 - 视觉语音识别和翻译PDF18 days ago
- 融合镁冶炼过程中的异常检测的跨模态学习:方法论和基准PDF19 days ago
- 多粒度语言指导的多目标追踪PDF25 days ago
- AnomalyDINO:使用 DINOv2 提升基于补丁的少样本异常检测PDFa month ago
- LucidPPN:用户中心可解释计算机视觉的明确范例部分网络PDFa month ago
- MM面向图像标注的检索增强架构PDFa month ago
- 通过姿势编码变分自动编码器实现多元化的手语表达PDF2 months ago
- GeoContrastNet:用于语言无关文档理解的对比键 - 值边缘学习PDF2 months ago
- CVPR基于检索增强的开放词汇物体检测PDF3 months ago
- 面向广义零样本学习的高判别属性特征学习PDF3 months ago
- 问题感知视觉变换器用于多模态推理PDF5 months ago
- 基于视觉 - 语言模型的图像融合PDF5 months ago
- iKUN:无需重新训练即可与追踪器对话PDF6 months ago
- 文本提示引导的图像恢复PDF7 months ago
- 6D 物体位姿估计结合零样本学习PDF7 months ago
- 基于剥夺指标的 StyleGAN2 街景图像合成的可视化抽象社会过程的生成模型PDF7 months ago
- 面向广义零样本学习的属性感知表示修正PDF7 months ago
- EMNLP印象:理解视觉符号学和美学冲击PDF8 months ago
- 通过一致性分配随机分区的视图进行表示学习PDF8 months ago
- IMITATE: 临床先验引导的分层视觉 - 语言预训练PDF9 months ago
Prev