Mar, 2023

AutoAD: 带上下文的电影描述

TL;DR本论文旨在提出一种将电影自动转化为文字形式的音频描述(AD)模型,该模型利用预训练模型,只训练桥接两个模型的映射网络来生成高质量的电影AD,解决电影AD依赖于上下文和训练数据有限等问题,并在电影AD任务上取得强劲的结果。