Sep, 2023

使用最优输运损失进行场景图生成中的谓词分类

TL;DR本研究提出了一种使用最优传输作为比较两个概率分布的方法生成场景图,以解决在数据集中关系标签分布严重不平衡时,使用交叉熵损失导致的预测偏差问题,并通过预训练模型获取单词的相似性来定义最优传输的运输成本,实验证明所提方法相对于现有方法在平均 Recall@50 和 100 方面表现更好,并且提高了数据集中少量存在的关系标签的召回率。