BriefGPT.xyz
Ask
alpha
关键词
multimodal compact bilinear pooling
搜索结果 - 1
探索多种方法在视觉问答中的应用
本研究探讨了使用生成对抗网络(GANs)、自编码器和注意力机制改进视觉问答(VQA)的创新方法。研究发现,通过利用一个平衡的 VQA 数据集,GAN-based 方法提供了生成与图像和问题相关的答案嵌入的潜力,但在处理较复杂的任务时存在困难
→
PDF
3 months ago
Prev
Next