BriefGPT.xyz
Ask
alpha
关键词
cross-modal framework
搜索结果 - 2
EMNLP
图像叙述中的半监督多模态指代消解
研究采用图像和描述性文本的多模态共指消解,在细粒度的图像 - 文本对齐、叙述语言的内在歧义和缺乏大规模标注数据集的条件下,提出了一种数据效率的半监督方法,用于解决多模态背景下的共指消解和叙述依托问题,通过跨模态框架结合有标注和无标注数据的损
→
PDF
9 months ago
MM
循环中的循环生成对抗网络用于关键点引导的图像生成
提出 C2GAN,一种新型循环生成对抗网络,用于关键点引导的图像生成,图像生成器和关键点生成器相互交错地连接在一个可端到端学习的框架中,并形成三个循环子网络,可生成更加逼真的图像。
PDF
5 years ago
Prev
Next