BriefGPT.xyz
Ask
alpha
关键词
vcr-wiki dataset
搜索结果 - 1
视觉字幕恢复
我们介绍了一种名为 Visual Caption Restoration(VCR)的新颖视觉 - 语言任务,该任务要求模型使用图像中的像素级提示准确恢复部分被遮挡的文本。我们开发了一个流程来生成用于 VCR 任务的合成图像,并构建了一个名为
→
PDF
a month ago
Prev
Next