Jul, 2023

随心所欲的视觉描述:由少量风格化句子引导的图像和视频描述

TL;DRFS-StyleCap 是一个用于 Few-Shot Stylized Visual Captioning 的框架,通过训练样本生成相关风格的标题描述,其在自动评估中的结果优于现有方法,并且在处理多种风格方面具有能力。