BriefGPT.xyz
大模型
Ask
alpha
关键词
mtxnet
搜索结果 - 1
MM
初探:通过视觉和文本解释实现可解释的 TextVQA 模型
该论文提出了一种可解释的深度学习模型 - MTXNet,着重于图像中的文本的多模态解释生成,并使用包含视觉信息和多种文本解释的新颖数据集 TextVQA-X 进行训练和评估,显示出该多模态解释与人类解释一致,有助于为模型的决策提供有用的见解
→
PDF
3 years ago
Prev
Next