关键词visual question generation
搜索结果 - 9
- AAAIConVQG:带有多模态引导的对比式视觉问句生成
通过使用对比可视化问题生成(ConVQG)方法,我们成功地提出了一种生成基于图像、文本约束以及知识的对比问题的方法,实验证明 ConVQG 在相关性、图像相关性和知识丰富性等方面优于现有方法,并通过人类评估显示对 ConVQG 问题的偏好。
- MM孟加拉语中的视觉问题生成
研究文章提出了一种基于变压器编码器 - 解码器架构的孟加拉语视觉问题生成任务和多种模型变体,通过在给定图像的情况下生成孟加拉语问题,并在翻译 VQAv2.0 数据集上进行训练和评估,结果表明我们的模型能够生成语法正确和相关的问题。
- K-VQG: 基于知识的视觉问题生成,用于常识获取
该研究通过构建一个基于知识的 VQG 数据集 K-VQG,引入了一个知识获取的角度,并开发了一种新的 VQG 模型,实验结果表明,该模型在 K-VQG 数据集上的表现优于现有的模型。
- CVPR深度例子网络用于 VQA 和 VQG
本文探讨了如何将示例方法融入 Visual Question Answering 和 Visual Question Generation 问题的深度学习架构中,通过大量实证研究发现,融入示例方法可以显著提高这些任务的性能。
- 视觉问答的双重任务:视觉问题生成
提出了 Invertible Question Answering Network (iQAN) 框架,该框架通过对 VQA 和 VQG 任务同时训练,利用图像中的问题和答案之间的互补关系,使用对应的参数共享方案和正则项来明确 Q,A 之间 - CVPR用变分自编码器生成多样性问题的创造力
本文提出了一种基于变分自动编码器和长短期记忆网络的视觉问题生成算法,能够生成大量多样的问题,实现了一种创造性的算法来生成逼真的问题。
- 基于场景的视觉问题的自动生成
本文提出了一种模型,能够从单个图像中生成具有不同类型的视觉问题。通过采样最可靠的问题类型来自动生成问,该方法在两个真实世界数据集上的实验结果表明,我们的模型在正确性和多样性方面都优于最强基线。
- 生成关于图像的自然问题
探索了关于一张图片是如何引发常识推理和抽象事件的问题,提出了一项新颖任务视觉问题生成(VQG),该系统的任务是在展示了一张图片后提出自然而引人入胜的问题,我们提供了三个数据集,涵盖了从目标为中心到事件为中心的各种图像,其中训练数据远比现有最 - 神经自我对话:通过持续问答实现图像理解
使用视觉问题生成和视觉问题回答模块结合循环神经网络和卷积神经网络方案,实现了图片内容的连续发现。