May, 2024

基于语言的三维人体理解与检索增强工具推理

TL;DRChatHuman 是一个基于语言驱动的人类理解系统,通过结合和整合多种不同方法的技能,利用大型语言模型(LLM)选择和使用各种现有工具来解决 3D 人类相关问题,并通过学术出版物指导应用 3D 人类相关工具、生成上下文学习示例以处理新工具以及辨别和整合工具结果以提升对 3D 人类理解的能力。与现有模型相比,在工具选择准确性和多个 3D 人类相关任务的性能方面,ChatHuman 表现出更好的性能,是将多样方法整合为单一强大的 3D 人类推理系统的一步。