关键词visual grounding
搜索结果 - 113
  • 从生成式视觉和语言模型中学习视觉定位
    PDF9 days ago
  • ECCV基于文本到图像扩散模型的开放词汇 3D 语义分割
    PDF9 days ago
  • 评估视觉叙事需要更多的评测指标
    PDF22 days ago
  • ECCVSegVG:将物体边界框转化为分割图像以进行视觉对齐
    PDF24 days ago
  • 基于注意力驱动的约束平衡的视觉定位
    PDF24 days ago
  • ICCV 2023 感知测试挑战的解决方案 -- 任务 6-- 基于视频的问题回答
    PDF25 days ago
  • CVLUE:一个新的面向中文视觉语言理解评估的基准数据集
    PDFa month ago
  • 关于视觉定位在 VQA 中的作用
    PDFa month ago
  • ACL基于 LLM 的改进和基于框的分割的地面多模态命名实体识别的推进
    PDF2 months ago
  • F-LMM: 冻结大规模多模态模型的基础
    PDF2 months ago
  • HPE-CogVLM:基于视觉语言模型的新头部姿势定位任务探索
    PDF2 months ago
  • LLM-Optic:揭示大型语言模型在通用视觉锚定中的能力
    PDF2 months ago
  • ICLR多模态大型语言模型的视觉定位对抗鲁棒性
    PDF2 months ago
  • DARA: 域和关系感知适配器 实现对视觉定位的参数高效调整
    PDF3 months ago
  • HiVG: 视觉引导的分层多模态细粒度调控
    PDF3 months ago
  • AgentStudio: 一个用于构建通用虚拟代理的工具包
    PDF4 months ago
  • MedPromptX: 融入视听提示的胸部 X 射线诊断
    PDF4 months ago
  • 基于模型和数据的视觉定位学习
    PDF4 months ago
  • WaterVG: 基于文本引导的视觉和毫米波雷达的水道视觉定位
    PDF4 months ago
  • 恰当的地方,合适的时间!面向非静态目标的导航
    PDF4 months ago
Prev