Apr, 2024

V2A-Mark: 多功能深度视听水印技术用于操作定位和版权保护

TL;DR通过将不可见的视听定位水印和版权水印嵌入原始视频帧和音频中,实现精确的操作定位和版权保护,解决当前视频篡改法医学中的限制,包括泛化能力差、功能单一和单模态聚焦等问题。同时,我们还设计了一个时间对齐和融合模块以及退化提示学习来提高定位精度和解码鲁棒性,引入了示例级音频定位方法和跨模态版权提取机制以耦合音频和视频帧的信息,从而验证了 V2A-Mark 在视听篡改数据集上的有效性,并强调其在定位精度和版权准确性方面的优势,对 AIGC 视频时代的可持续发展至关重要。