Jan, 2023

面向目标驱动的二元交流的情感面孔

TL;DR本研究介绍了一种视频框架,用于建模双人对话中口头和非口头交流之间的关联,提出了一种通过大型语言模型和视觉-语言模型构成的对话建模方法,并提出了一种新的无剧本对话视频数据集,实验和可视化结果表明,该方法能够生成显著更具社交适切性的监听者。