关键词grounding capabilities
搜索结果 - 5
  • 3D-GRAND: 为 3D-LLMs 提供更好的定位和更少的幻觉
    PDFa month ago
  • CVPRQ-GroundCAM: 通过 GradCAM 度量视觉语言模型中的基准化能力
    PDF2 months ago
  • 多模态指导的细粒度视觉感知语言模型优化
    PDF4 months ago
  • PG-Video-LLaVA:像素定位大型视频 - 语言模型
    PDF7 months ago
  • ACL利用预训练语言模型唤醒潜在的语义关系推理能力
    PDF3 years ago
Prev
Next