BriefGPT.xyz
Ask
alpha
关键词
multimodal generalization
搜索结果 - 2
ICLR
论多模态推理中神经网络的泛化能力
评估了多模态泛化的综合性能,发现多层注意力和跨模态注意力是整合多模态输入所需的关键架构特征,但对于有限类型的多模态泛化存在基本限制,强调了现代神经模型在多模态推理方面的优势和局限性。
PDF
5 months ago
CVPR
MMG-Ego4D: Egocentric 动作识别多模态泛化
该研究论文探讨了在自心视角动作识别中一个新的问题,即 “多模态推广”,研究了系统在某些模态的数据受限或完全缺失时如何进行推广,并构建了一个包含视频、音频和惯性运动传感器模态的数据集。
PDF
a year ago
Prev
Next