Jun, 2023

MSVD-Indonesian: 一种用于印度尼西亚多模式视频文本任务的基准

TL;DR本文介绍了开发第一个印象尼西亚视频文本数据集的方法,并使用交叉语言迁移学习来改进三个任务的表现,即文本到视频检索,视频到文本检索和视频字幕生成。