BriefGPT.xyz
Ask
alpha
关键词
automated image captioning
搜索结果 - 2
IJCAI
适用于视力受损人士的质量不敏感图像字幕技术
本文提出了一种质量不受限制的框架,通过数据增强、双网络架构和置信度校准,来提高视障人士图像字幕模型的性能和稳健性,并在与 Royal National Institute of Blind People 合作的辅助生活应用中实现了改进的模型
→
PDF
a year ago
CVPR
利用偏序关系引导注意力进行图像字幕生成
本文提出了一种引导式的注意力网络机制,将图像的空间特征、主题的高级信息以及生成的字幕的时间上下文嵌入到一个有序的嵌入空间中进行训练,采用成对的排序目标函数,该模型在 MSCOCO 数据集上表现出与众多最先进模型相媲美的竞争力。
PDF
2 years ago
Prev
Next