Nov, 2024

通过递归分配实现自适应长度图像标记

TL;DR本研究解决了当前视觉系统对图像采用固定长度表示的问题,提出了一种学习可变长度标记表示的方法。通过递归处理2D图像标记的编码-解码架构,实现了根据图像信息内容自适应调整标记数量,从而显示出在对象和部分发现方面的潜力。