Apr, 2016

TGIF:一个新的动态图描述数据集与基准

TL;DR本研究收集了10万个GIF图像,并基于众包技术获取了120k自然语言描述,以促进对动态图像的理解和自然语言描述生成技术的研究,该研究提供了一个理想的基准来评估视觉内容字幕的任务。研究还提供了基于最近邻算法、统计机器翻译和递归神经网络的动态gif描述任务的基线结果,并证明使用该数据集微调的模型对于自动电影描述是有帮助的。