BriefGPT.xyz
大模型
Ask
alpha
关键词
textual and visual modalities
搜索结果 - 3
MMUTF: 统一模板填充的多模态多媒体事件论元抽取
通过引入统一的模板填充模型,我们的方法可以连接文本和视觉模态,并通过文本提示实现跨本体转移和事件特定语义的整合。在 M2E2 基准上的实验证明了我们方法的有效性,我们的系统在文本 EAE 上超过当前的最佳方法 7% F1,且在多媒体 EAE
→
PDF
16 days ago
多模态机器翻译调查:任务、方法与挑战
多模态机器翻译是近年来引起学术界和工业界广泛关注的研究领域,本文通过综述先前的 99 项研究工作,全面总结了主要模型、数据集和评估指标,分析了各种因素对模型性能的影响,并讨论了未来该领域的研究方向。与之前限制在早期多模态机器翻译的调查不同,
→
PDF
a month ago
多模态立场检测:新数据集和模型
通过整合文本和图像的多模态信息,文章提出了一种简单而有效的 TMPT 框架,利用目标信息从文本和视觉模态学习多模态姿态特征,并在三个基准数据集上取得了最先进的多模态姿态检测性能。
PDF
4 months ago
Prev
Next