BriefGPT.xyz
Ask
alpha
关键词
part-of-speech enhanced image-text matching model
搜索结果 - 1
CVPR
通过提炼图像 - 文本匹配模型,实现更加扎实的图像字幕生成
本研究提出了一种基于 Part-of-Speech 增强图像 - 文本匹配模型的方法(称为 POS-SCAN),以提高图像字幕准确性,并且探讨了图像 - 文本匹配分数作为奖励用于更加接近实际对象的图像字幕训练。
PDF
4 years ago
Prev
Next