BriefGPT.xyz
大模型
Ask
alpha
关键词
bsq-vit
搜索结果 - 1
使用二进制球面量化对图像和视频进行令牌化
提出了一种新的基于转换器的图像和视频分词器,使用二值球面量化实现。BSQ 将高维视觉嵌入投影到低维超球面上,然后应用二值量化。我们的分词器使用变长视频输入的转换器编码器和解码器,通过简单的分块因果掩蔽实现。基于此的 BSQ-ViT 在图像和
→
PDF
23 days ago
Prev
Next