BriefGPT.xyz
大模型
Ask
alpha
关键词
modality imbalance problem
搜索结果 - 2
AAAI
迈向平衡对齐:视频时刻检索的模态增强语义建模
通过提升视频模态和文本模态的特征,Modal-Enhanced Semantic Modeling(MESM)框架在视频短片检索中实现了更平衡的对齐,填补了形式上不平衡的模态差距。实验证明该框架在多个基准测试上取得了显著的泛化能力和最佳效果
→
PDF
6 months ago
MMoT: 混合模态词元变换器用于组合多模态条件图像合成
提出了一种基于混合多模态令牌变换器的组合多模态条件图像合成技术,解决了多模态控制信号协调问题和不平衡问题,实现了在复杂多模态条件下的高质量和忠实的图像合成。
PDF
a year ago
Prev
Next