BriefGPT.xyz
大模型
Ask
alpha
关键词
textual semantics
搜索结果 - 5
理解档案:依赖于文档的语义注释的新研究界面
通过文本语义的语义注释,研究档案文件的构建框架和技术障碍的解决方案以及实际应用
PDF
3 months ago
面向少样本动作识别的语义感知视频表示
我们提出了一种简单而有效的语义感知少样本动作识别模型(SAFSAR),该模型通过直接利用 3D 特征提取器与有效的特征融合方案以及简单的余弦相似度分类,实现了更好的性能,无需复杂的距离函数和额外的时间建模组件。在这种方案中,SAFSAR 以
→
PDF
8 months ago
ICLR
StrucTexTv2: 遮蔽式视觉文本预测用于文档图像预训练
本文提出了一种名为 StrucTexTv2 的有效的文档图像预训练框架,通过执行掩码视觉 - 文本预测。它由两个自我监督的预训练任务组成:掩码图像建模和掩码语言建模,基于文本区域级别的图像掩码。经实验验证,该模型在文档图像理解的各个下游任务
→
PDF
a year ago
MF2-MVQA:一种医学视觉问答的多阶段特征融合方法
本研究提出了一种简单却强大的多阶段特征融合方法 MF2-MVQA,它能有效利用医学图像的多尺度信息,实现了医疗视觉问答任务中语言与医学图像的特征融合,并在 VQA-Med 2019 和 VQA-RAD 数据集上实现了最先进的性能,可视化结果
→
PDF
2 years ago
TeKo:带外部知识的文本丰富图神经网络
提出了一种基于外部知识的文本丰富图神经网络,能够充分利用文本丰富网络中的结构和文本信息,并设计了一种相互卷积机制用于构建异构语义网络,从而实现网络结构和文本语义的互动,得出了优于现有基线的实验结果。
PDF
2 years ago
Prev
Next