May, 2022

BAN-Cap: 一种多用途的英孟加拉图像描述数据集

TL;DR本文介绍 BAN-Cap 数据集,通过对该数据集进行基准测试,结合文本增强方法和自适应注意力模型,展示了我们的模型在孟加拉语图片字幕生成任务中的卓越性能及多功能性,包括机器翻译。