Mar, 2024

建模概率模型解决邦加德 - 标志问题

TL;DR本研究介绍了 PMoC,这是一种为 Bongard-Logo 问题量身定制的概率模型,通过构建独立的概率模型实现了高准确性的推理。此外,我们还提出了 Pose-Transformer,这是一种专为复杂的抽象推理任务设计的增强型 Transformer-Encoder,包括 Bongard-Logo、RAVEN、I-RAVEN 和 PGM。Pose-Transformer 结合了位置信息学习,受胶囊网络中的姿势矩阵启发,增强了其对图像数据处理中的局部位置关系的关注。当与 PMoC 集成时,它进一步提高了推理准确性。我们的方法有效地解决了与抽象实体的位置变化相关的推理困难,在 RAVEN 的 OIG、D3×3 子集和 PGM 数据库上超过了之前的模型。本研究对于推进 AI 在抽象推理和认知模式识别方面的能力具有重要贡献。