Oct, 2023

LiveChat: 从视听多模态环境生成视频评论

TL;DR通过创建大规模的音视频多模式对话数据集,以促进直播评论技术的发展,我们还提出了一种能够生成与视频中的时空事件以及正在进行的多模式对话上下文相吻合的实时评论的新颖多模式生成模型。