BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal fusion transformer
搜索结果 - 3
面向高效简历理解的多粒度多模态预训练方法
本文提出了一种名为 ERU 的新型模型,通过引入多模态融合变压器编码简历段落的布局感知信息,设计三个自监督任务用于无标签简历的预训练,并通过多粒度序列标记任务对模型进行微调,从简历中提取结构化信息,实验证明 ERU 的有效性。
PDF
2 months ago
M2DA:多模态融合 Transformer 结合驾驶员注意力用于自动驾驶
提出了一种多模态融合变压器,结合驾驶员注意力用于自动驾驶,通过 Lidar-Vision-Attention-based Fusion 模块更好地融合多模态数据,并实现不同模态之间更高的对齐,同时结合驾驶员的注意力,赋予自动驾驶车辆类似于人
→
PDF
3 months ago
基于多模态融合变换器的瓷砖分类视口预测
提出了一种基于瓷砖分类的视口预测方法,使用多模态融合变压器提取每种模态的长距离依赖关系,从而捕捉用户历史输入和视频内容对未来视口选择的综合影响,并根据瓷砖的二分类结果选择未来视口,具有更好的鲁棒性和解释性。在两个常用的 PVS-HM 和 X
→
PDF
9 months ago
Prev
Next