BriefGPT.xyz
Ask
alpha
关键词
localized narratives
搜索结果 - 3
ACL
在视觉 - 语言模型中实现交互式区域理解
通过引入具有明确区域建模能力的 RegionVLM 模型,并利用包含区域信息的 Localized Narratives 数据集,我们的实验表明,我们的单一通用模型不仅实现了交互式对话系统,还在各种零样本区域理解任务上展现出了卓越的性能,而
→
PDF
3 months ago
基于细粒度用户注意力的文本到图像生成
提出了基于 Local Narratives 数据集和 TReCS 模型的图像文本生成方法,在视觉的基础上,利用分割掩模等技术实现了更好的图像合成效果。
PDF
4 years ago
ECCV
连接视觉和语言的局部叙述
我们提出了一种新的多模态图像标注方法,称为定位叙述,将视觉和语言进行连接。通过请求标注者在将鼠标指针悬停在要描述的区域的同时用语音来描述图像,我们实现了对每个单词进行定位。该方法经过全面的分析和外部数据验证,具有高度准确性和生产效率,并且在
→
PDF
5 years ago
Prev
Next