BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal input
搜索结果 - 2
ACL
多模态命名实体识别的图像文本对齐
本文提出了一种基于图像与文本对齐的多模态命名实体识别技术,通过将图像特征与文本信息在文本空间中对齐,将两者之间的交互作用结合在一起,以此提高命名实体识别的准确性。
PDF
3 years ago
ACL
多模态指令中的符号基础
本文提出了一种方法来处理跨模态输入的原始流,以产生物体的细分并与高级概念相关联,以学习用户的颜色和形状的概念,并表明该模型可以从少量的物理演示中推广到识别新单词的物理指示。
PDF
7 years ago
Prev
Next