Jun, 2024

文本转事件:有条件文本输入的合成事件相机流

TL;DR使用文本生成模型和扩散模型,本研究提出了一种用于创建新的标记事件数据集的方法,通过合成事件帧直接从文本提示生成平滑的移动对象事件流。根据不同文本语句,该模型能够生成真实人体动作的逼真事件序列,其分类准确率在 42% 至 92% 之间,展示出合成事件数据集的能力。