Apr, 2023
视频聊天字幕生成器:朝向丰富化的时空描述
Video ChatCaptioner: Towards the Enriched Spatiotemporal Descriptions
Jun Chen, Deyao Zhu, Kilichbek Haydarov, Xiang Li, Mohamed Elhoseiny
TL;DR本研究提出了一个新的视频描述方法,即 Video ChatCaptioner,它使用 ChatGPT 模型作为控制器,提出视频内容驱动的问题并回答这些视觉查询,从而生成包含更多视觉细节的视频标题。