BriefGPT.xyz
大模型
Ask
alpha
关键词
alignment weaknesses
搜索结果 - 1
EMNLP
从文本角度探究跨模态语义对齐能力
本文提出了一种基于图像字幕生成的新型探测方法,用于研究视觉语言预训练模型中跨模态语义对齐的内部机制,发现 VLP 模型对齐的主要是对象和视觉词,忽略了全局语义,还存在固定的句子模式,无视语法和流畅性等问题。
PDF
2 years ago
Prev
Next