Jan, 2024

KTVIC:一个基于生活领域的越南图像描述数据集

TL;DR我们介绍了 KTVIC,一个全面的越南图像字幕数据集,专注于生活领域,涵盖广泛的日常活动。我们在该数据集上使用各种深度神经网络作为基准进行实验证明了提出的数据集的有效性和对越南图像字幕领域的潜在贡献。