BriefGPT.xyz
大模型
Ask
alpha
关键词
screenshots
搜索结果 - 2
CVPR
丰富监督提升视觉 - 语言预训练
提出了一种新的预训练范式 —— 基于网络截图的强监督预训练(S4),利用大规模网络截图渲染的数据进行视觉语言模型的预训练。通过使用网络截图,可以获取在图像 - 文本对中不存在的丰富的视觉和文本线索。在 S4 中,利用 HTML 元素的树状层
→
PDF
4 months ago
从图像到标题:使用卷积神经网络进行视频游戏辨识
通过使用五种卷积神经网络(MobileNet、DenseNet、EfficientNetB0、EfficientNetB2 和 EfficientNetB3),对 22 种家用游戏主机系统(从 Atari 2600 到 PlayStatio
→
PDF
7 months ago
Prev
Next