通过使用合成的稀有场景图并基于条件生成对抗网络的模型,可以解决在场景图生成中面临的组合泛化问题,提高新颖组合成分的准确性
Jul, 2020
通过提出一种新的多智能体演员 - 评论家方法,使用中心化评论家估算 Q 函数和分散化演员来优化智能体的策略,使用反事实基线来处理多智能体学分分配的挑战,该方法能够有效地学习到分散式问题的解决方案,并在星际争霸微操作测试环境中显著提高了绩效表现。
May, 2017
本文提出了一个基于因果关系的 Counterfactual Adversarial Training 框架(CAT),通过对单个样本生成对应的反事实表示,动态调整样本特有的损失权重,以此鼓励模型探索真实的因果关系,实现在句子分类、自然语言推理和问答等领域的显著性能提升。
Sep, 2021
本研究提出使用场景图上下文来改善场景图的图像生成,通过引入上下文网络将图卷积神经网络生成的特征并入图像生成网络和对抗性损失,从而不仅能够生成逼真的图像,还能更好地保留非空间对象之间的关系,并定义两个评估指标,Relation Score 和 Mean Opinion Relation Score,直接评估场景图的一致性,并经过定量和定性研究证明了该模型在这一具有挑战性的任务上优于现有技术。
Jan, 2019
该研究提出了一种基于图卷积和多因素策略梯度的架构,用于解决在多观察环境下多智能体之间合作最大化系统功用时的通信和奖励分配问题,并在一系列任务中取得了优异表现。
Apr, 2020
本文提出了一个用于无条件生成场景图的生成模型 SceneGraphGen,通过层级循环架构直接学习带标签和有向图的概率分布,生成的场景图多样且遵循真实场景的语义模式,同时还证明了生成的图在图像合成、异常检测和场景图完整性方面的应用。
Aug, 2021
本文提出了一种新方法,利用场景图像来推理自然语言中描述的行为的影响,并在现有的 CLEVR_HYP (Sampat et.al,2021) 数据集上进行了实验,显示出与现有模型相比,该方法在性能,数据效率和泛化能力上都具有有效性。
Dec, 2022
提出了一种利用场景图生成图像的模型,其中包括图形卷积来处理输入图形、预测对象的边界框和分割掩模来计算场景布局,并使用级联细化网络将布局转换为图像,训练对抗鉴别器来确保生成的图像具有逼真度。
Apr, 2018
本研究提出使用生成对抗网络(GAN)生成细粒度场景图的方法,该方法首先生成单个关于具体区域场景的子图,并在不需要边界框标签的情况下,生成带属性信息的场景图。实验证明了该模型在数据集上的表现优于之前的工作,并能处理更大的词汇量。
Feb, 2018
论文提出了一种通过获取视觉常识来改善场景图生成模型的鲁棒性的方法,并使用 Transformer 模型结合场景图结构训练了 GLAT 模型,该模型可以纠正明显的错误。通过实验证明,该模型比其他方法更好地学习了视觉常识,并提高了最先进场景图生成模型的准确性。
Jun, 2020