cross-modal adaptation | BriefGPT

关键词cross-modal adaptation

搜索结果 - 4

CVPRX-MIC：基于跨模态实例条件的自我中心动作泛化
通过提出的简单而有效的跨模态适应框架 X-MIC，我们在图像和第三人称视频分类中将视觉语言模型（VLMs）成功进行零样本识别的研究成果进一步应用到自视角视频，通过学习在共享嵌入空间中在视频适配器的帮助下，将文本嵌入与每个自视角视频对齐，最终
PDF3 months ago
CVPREventDance: 无监督的无需源域跨模态适应用于事件驱动的物体识别
通过无标签目标事件数据的提取知识，提出了一种用于无监督源自由跨模态适应问题的新框架 EventDance，包括基于重构的模态桥接模块（RMB）和多表示知识适应模块（MKA），并与源模型相互更新，从而使得 EventDance 能在多个领域进
PDF4 months ago
UPS：通过跨模态适应实现 PDE 求解的基础模型
我们介绍了 UPS（统一 PDE 求解器），这是一种有效和数据高效的方法，用于解决各种定义在不同领域、维度和分辨率上的时空 PDE。UPS 将不同的 PDE 统一到一个一致的表示空间中，并使用具有领域特定神经算子的统一网络架构处理各种 PD
PDF4 months ago
弥合语音到文本翻译的模态差距
提出了一种称作 STAST 的语音转写自适应模型，通过分离语音翻译编码器为三个部分以及引入跨模态自适应方法来缩小语音和文本的模态差距，进而在英法和英德语音翻译数据集上实现了显著的性能优越。
PDF4 years ago