BriefGPT.xyz
Ask
alpha
关键词
3d spatial relationships
搜索结果 - 2
HPE-CogVLM:基于视觉语言模型的新头部姿势定位任务探索
本研究使用 CogVLM 的视觉定位能力,提出了一种新的框架来增强头部姿态估计任务,通过改进大语言模型中的灾难遗忘问题和引入 LoRA 层模型合并方法,有效提高头部姿态估计性能,并且在多个指标上优于现有方法。
PDF
a month ago
CVPR
基于文本的图像检索的全面三维场景抽象生成
使用物理关系模型,通过将虚构的抽象物体布局与文本描述中存在的空间约束相匹配来从文本描述中推断 3D 结构,并通过将对象检测输出与表示为边界框的 2D 布局候选项进行匹配来评定图像排序,从而检索与场景的文本描述相匹配的图像,其性能优于基于对象
→
PDF
8 years ago
Prev
Next