BriefGPT.xyz
大模型
Ask
alpha
关键词
beit
搜索结果 - 4
使用 Transformer 和卷积进行食品图像分割的知识转移
本文研究了食物图像分割的困难,提供了一个鲁棒的基准数据集 FoodSeg103,采用卷积神经网络和双向编码器表示图像转换器(BEiT)进行对比,并证明 BEiT 在食物图像分割中的表现优于其他模型,表明转移学习可以提高图像分割性能。
PDF
a year ago
一种基于 Transformer 模型的端到端 OCR 框架,用于识别具有变音符的大规模古典阿拉伯文多字体语料库的手写体 Arabic 识别
本文介绍了针对阿拉伯历史文献的光学字符识别技术的研究,提出了一种端到端文本识别方法 BEIT,并通过实验比较证明,该方法优于卷积神经网络的特征提取方法,达到了 4.46% 的识别准确率。
PDF
2 years ago
ICLR
自监督视觉预训练的损坏图像建模
本篇论文介绍了 Corrupted Image Modeling (CIM) 用于图像自监督预训练,通过使用额外的生成器和小型可训练 BEiT 对输入图像进行损坏来实现,而不是使用人工 MASK 令牌,并在训练后可以将增强器用作下游任务的高
→
PDF
2 years ago
BEiT: 图像 Transformer 的 BERT 预训练
本研究介绍了一种名为 BEiT 的自监督视觉表示模型,使用双向编码器表示图像转换器并进行了预训练,效果显著。
PDF
3 years ago
Prev
Next