关键词grounding capabilities
搜索结果 - 5
- 3D-GRAND: 为 3D-LLMs 提供更好的定位和更少的幻觉PDFa month ago
- CVPRQ-GroundCAM: 通过 GradCAM 度量视觉语言模型中的基准化能力PDF2 months ago
- 多模态指导的细粒度视觉感知语言模型优化PDF4 months ago
- PG-Video-LLaVA:像素定位大型视频 - 语言模型PDF7 months ago
- ACL利用预训练语言模型唤醒潜在的语义关系推理能力PDF3 years ago
Prev
Next