BriefGPT.xyz
Ask
alpha
关键词
transformer utilization
搜索结果 - 1
自动驾驶预训练视觉问答模型的性能分析
这篇简短研究在回答与驾驶场景相关的问题的背景下,对 ViLBERT、ViLT 和 LXMERT 这三种流行的视觉问答(VQA)模型进行初步分析。通过比较计算机视觉专家提供的参考答案与模型输出答案的相似性来评估这些模型的性能。分析了多模态架构
→
PDF
a year ago
Prev
Next