BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal cot
搜索结果 - 2
COLING
通过软负采样增强多模态思维链中的语义
利用软负采样的方法减轻多模式 CoT 中幻觉问题的研究提出了一种理性生成方法(SNSE-CoT)。在传统的对比学习框架中引入了五种方法来生成高度相似但具有不同语义的软负样本,并通过双向边界损失将其应用于多模式 CoT 中,对 Science
→
PDF
2 months ago
Cantor: MLLM 的多模态思维链激发
通过结合视觉环境获取和逻辑推理,本论文提出了一种名为 Cantor 的创新的多模态 CoT 框架,利用多模态大语言模型的认知能力解决复杂的视觉推理任务,该框架通过分析图像和问题实现对视觉输入的整合,利用大语言模型的高级认知功能生成更高级别的
→
PDF
2 months ago
Prev
Next