multimodal problem | BriefGPT

关键词multimodal problem

搜索结果 - 5

MMSR：符号回归为多模态任务
该研究论文提出了一种名为 MMSR 的方法，通过解决多模态对齐的对比学习问题，将纯符号回归问题转化为一个纯多模态问题，并通过模态特征融合提升了性能，实验结果表明 MMSR 在多个主流数据集上与多个大规模预训练基准模型相比取得了最先进的结果。
PDF4 months ago
论证态度预测：多模态与少样本学习的探索性研究
通过对推文中的立场预测的图像的必要性进行了评估，并使用了现有的大型语言模型进行了对比，研究表明，精调的基于文本的语言模型的集合优于多模态模型和使用最新的大型语言模型进行的基于文本的少量训练数据的预测。此外，多模态模型在将图像内容摘要为自然语
PDF9 months ago
MM找到对抗性示例所需的维数是多少？
研究对抗性漏洞的影响因素，得出标准 PGD 攻击的成功率呈单调递增的函数关系，表明对抗样本在高维空间局部线性模型上很普遍。
PDFa year ago
LocalTrans: 跨尺度局部 Transformer 网络用于分辨率变换下的单应性估计
本文提出了一种多模态的局部变换网络嵌入多尺度结构中，以显式学习分辨率不同的输入图像之间的对应关系，用于解决多尺度千亿像素摄影中的交叉分辨率匹配问题。实验证明，该方法在 MS-COCO 数据集和真实拍摄的交叉分辨率数据集上表现优于其他基于特征
PDF3 years ago
ACL更好地利用图片描述提升图像字幕质量
本文提出了一种新的图像字幕架构，通过构建以字幕为导向的视觉关系图以及利用弱监督多实例学习引入有益的归纳偏差来增强图像表示和字幕生成，实现多模态问题解决和优化。在 MSCOCO 数据集上进行广泛实验，证明该框架在多种评估指标下取得了业内最优表
PDF4 years ago