May, 2023

改进的概率图像文本表示

TL;DR本文提出了一种改进的概率交叉模态嵌入(PCME ++)方法,用于改进图像文本匹配(ITM)中可能存在的模糊度问题,并通过引入一种新的概率距离与解决方案以及两种优化技术来进一步增强 PCME ++。该研究表明,PCME ++ 相对于最先进的 ITM 方法具有良好的鲁棒性,并可应用于零样本分类中自动提示调优的实践中。