BriefGPT.xyz
Ask
alpha
关键词
visual language understanding
搜索结果 - 4
CVPR
BERT 是否盲目?探索视觉语言预训练对视觉语言理解的影响
本研究探讨了图像与语言预训练是否可以提高模型在需要隐含视觉推理的文本任务上的性能,提出了一系列用于探测文本编码模型视觉推理能力的任务,并说明了采用多模态预训练方法可以提高文本编码器的性能。
PDF
a year ago
探索外部知识以准确地建模视觉和语言问题
本文介绍了一种利用外部知识提高人工智能任务性能的方法,将其应用于视觉语言理解、机器翻译和图像字幕制作等任务,并且在这些任务建模中显著提升表现。
PDF
a year ago
AAAI
视觉和语言中的抽奖券玩法
本文通过实证研究发现,大规模的预训练 VL 模型中存在可训练的子网络,该子网络可通过精细修剪结构实现高精度计算并具有良好的通用性。
PDF
3 years ago
CVPR
ALFRED: 为日常任务解释基础指令的基准测试
ALFRED 是一个用于学习自然语言指令和自我中心视觉到家庭任务动作序列映射的基准测试,包括 25k 个自然语言指令的交互式视觉环境的专家演示,并在序列长度,动作空间和语言方面比现有的视觉和语言任务数据集更复杂。
PDF
5 years ago
Prev
Next