Nov, 2022

面向文本的双路由网络用于视觉问答

TL;DR提出了一种名为TDR的基于文本感知的双路由神经网络,在视觉问题回答方面取得了优异表现,特别是在与数字相关的问题上。