Apr, 2025
基于基础模型的人机交互预测框架与分割掩膜集成
Foundation Model-Driven Framework for Human-Object Interaction
Prediction with Segmentation Mask Integration
TL;DR本研究针对传统的人机交互方法的不足,提出了一种新的Seg2HOI框架,将基于分割的视觉基础模型与人机交互任务整合。研究发现,该框架在不增加额外训练机制的情况下,仍能有效生成包括分割掩膜的四元组,且在多个公开基准数据集上的实验结果显示其性能可与最先进的方法相媲美,具有良好的应用潜力。