Jul, 2022

关于存在于时空中的物体的视频对话交流

TL;DR本研究提出了一种基于对象中心框架的视频对话系统,称为COST,该系统支持神经推理和关系推理,通过对视频中对象轨迹的分解来支持基于对象的对话状态更新和推理,可实现高水平的语言生成。经DSTC7和DSTC8基准测试,COST具有与最先进技术的竞争力。