BriefGPT.xyz
Ask
alpha
关键词
end-to-end transformer
搜索结果 - 2
视觉问答机器人手术中采用共同关注门控视觉语言嵌入的本地化回答
本研究提出了一种基于端到端 Transformer 与协同注意力门控视觉 - 语言嵌入的外科手术场景中可定位答案的视觉问答系统,该方法不需要通过检测模型进行特征提取,并建立在数据高效图像 Transformer 模块、并行分类器和检测器之上
→
PDF
a year ago
CVPR
Omni-DETR:利用 Transformer 的全监督全目标检测
研究使用统一结构 Omni-DETR 进行 omni-supervised 物体检测,将弱标注转化为准确的伪标注用于学习,取得了多个数据集的最优结果。
PDF
2 years ago
Prev
Next