MMNov, 2022
VieCap4H-VLSP 2021:基于注意力机制的对象关系变换器在越南图片字幕生成中的性能优化
VieCap4H-VLSP 2021: ObjectAoA-Enhancing performance of Object Relation Transformer with Attention on Attention for Vietnamese image captioning
Nghia Hieu Nguyen, Duong T.D. Vo, Minh-Quan Ha
TL;DR本研究提出了一种有效的方法来改进基于转换器的图像理解方法,通过在对象关系转换器结构上扩展 Attention on Attention 机制,实验表明我们的方法在 VLSP 举办的 Image Captioning 共享任务的公共测试和私人测试中显著优于原始结构。