BriefGPT.xyz
大模型
Ask
alpha
关键词
object relation transformer
搜索结果 - 2
MM
VieCap4H-VLSP 2021:基于注意力机制的对象关系变换器在越南图片字幕生成中的性能优化
本研究提出了一种有效的方法来改进基于转换器的图像理解方法,通过在对象关系转换器结构上扩展 Attention on Attention 机制,实验表明我们的方法在 VLSP 举办的 Image Captioning 共享任务的公共测试和私人
→
PDF
2 years ago
图像字幕生成:物体到文字的转换
本文介绍了一种名为 “Object Relation Transformer” 的图像描述模型,该模型在编码器 - 解码器架构中显式地整合了有关输入检测对象的空间关系,以几何关注的方式建模。结果表明,这种几何关注对图像描述非常重要,并在 M
→
PDF
5 years ago
Prev
Next