multimodal embeddings | BriefGPT

关键词multimodal embeddings

搜索结果 - 5

模态转移中的杠杆点：比较仅语言和多模态词表示
本研究比较了来自不同模型的单词嵌入，在 46 个语义参数中识别出最受视觉语境影响的单词，并发现视觉模态效应与涉及具体性的指示语义属性最相关，但也适用于多个特定的语义类别，以及与情感相关的联想语言表达的倾向属性。
PDFa year ago
SemEval2023 任务 1 中的 OPI: 面向视觉词义消歧的图像 - 文本嵌入和多模态信息检索
本研究提出采用多模态模型、排序学习以及基于知识的方法来进行词义消歧，并在 SemEval 2023 视觉词义消歧共享任务中荣获波斯语赛道的冠军以及多语言赛道的第三名。
PDFa year ago
聚合多模态嵌入进行跨目标立场检测的小样本学习
本文提出了一种使用文本和网络特征进行多模态嵌入的新模型 CT-TN 来解决社交媒体中的跨目标立场检测问题，在跨目标场景下的实验结果表明，相比于现有的基线模型，CT-TN 的平均性能提高了 11% 至 21%，表明了其有效性。实验中还发现 C
PDFa year ago
文档理解的统一预训练框架
UDoc 是一个新的文档理解的统一预训练框架，它通过使用三个自监督损失约束表示模型，将单词和视觉特征作为输入，使神经网络从无标签的数据中学习到更好的文档表示，并取得了下游任务的提升。
PDF2 years ago
ACL基于多模态嵌入的动词无监督视觉语义消歧
本文介绍了一项新任务：为动词进行视觉意义消歧，以此作为多模态任务如图像检索和图像描述的基础，并提出了基于 Lesk 算法的无监督算法来执行视觉意义消歧，说明了在有和无标注图像情况下，文本嵌入和多模态嵌入的性能。本文最终提供了 VerSe 数
PDF8 years ago