May, 2024

PuzzleAvatar: 个人相册中的三维头像拼装

TL;DR使用个人连拍的照片集合生成个性化的3D头像,通过一个新的模型 PuzzleAvatar,利用图像中的外观、身份、衣物、发型和配饰等特征,将其编码为学习到的令牌,并将这些线索融合到一个基础的视觉-语言模型中,通过组装学习到的令牌来实现生成连拍照片集合中忠实的个性化3D头像,具有高重建准确性、可伸缩性和鲁棒性。