Oct, 2024

MuVi:具有语义对齐和节奏同步的视频到音乐生成

TL;DR本文研究了如何生成与视频视觉内容一致的音乐,解决了生成音乐与视觉叙事之间的深度理解问题。提出的MuVi框架通过独特的视觉适配器分析视频内容,从而生成与视频的情感、主题、节奏和节拍相匹配的音乐,显著提高了音视内容的融合体验。实验结果表明,MuVi在音质和时序同步方面表现出色。