CVPRMar, 2024

LLMs 是优秀的动作识别器

TL;DR通过将大型语言模型视为动作识别器,并采用语言投影过程将骨架动作序列转化为 “动作句子”,提出了一种新颖的 LLM-AR 框架,通过结合多种设计进一步促进语言投影过程,验证了该框架的有效性。