ICCVAug, 2023

语言模型能否学会倾听?

TL;DR基於語言模型和量化的原子運動元素,我們提出了一種生成聽眾適當面部反應的框架,以回應演講者的言談,並展示了模型在定量指標和定性用戶研究中生成流暢且反映語義的聽眾動作的能力。