May, 2025
T2VTextBench:一种用于视频生成模型文本控制的人类评估基准
T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video
Generation Models
TL;DR本研究针对当前视频生成模型在准确呈现屏幕文本方面的不足,提出了T2VTextBench,这是第一个专门评估文本准确性和时间一致性的人类评估基准。通过测试十种最新系统的能力,发现大多数模型在生成清晰一致的文本方面存在显著挑战,为未来在视频合成中改善文本处理提供了明确的研究方向。