CVPRApr, 2024

基于语言规范的自然监督下的三维视觉植根

TL;DR本论文提出了一种利用语言为约束的 Language-Regularized Concept Learner (LARC) 方法,通过从语言属性中提取约束,显著提高了自然监督环境下神经符号概念学习器的准确性,改进了之前工作在自然监督的 3D 视觉定位方面的性能,并展示了广泛的三维视觉推理能力,包括零样本组合、数据效率和可迁移性,为学习无密集监督环境的结构化视觉推理框架打下了有前景的基础。