Jan, 2024

ANIM-400K:一个大规模数据集用于视频自动配音的端到端系统

TL;DR我们介绍了 Anim-400K,这是一个包含超过 425K 对齐的日语和英语动画视频片段的全面数据集,支持各种与视频相关的任务,包括自动配音、同声翻译、引导式视频摘要和类型 / 主题 / 风格分类。我们的数据集已公开发布供研究目的使用。