BriefGPT.xyz
Ask
alpha
关键词
vision architectures
搜索结果 - 2
ACC-ViT: 视觉 Transformer 中空洞卷积的回归
通过从视觉感知中汲取灵感进行注意机制创新,Transformer 已经成为最先进的视觉架构。本文引入了一种融合区域和稀疏注意力的 Atrous Attention,它能够自适应地整合局部和全局信息,并保持层次关系,提出了一种通用的混合式视觉
→
PDF
4 months ago
所有视觉模型都一样吗?一项有关开环到闭环因果间隙的研究
本文针对机器人应用中离线训练与在线闭环部署之间的因果差异来研究现代神经网络模型的性能表现,发现在合适的训练条件下,所有视觉网络结构在内部部署下表现相同,但在数据分布发生偏移时,无论模型选择都会失去目标,需要进一步针对数据多样性而非模型结构进
→
PDF
2 years ago
Prev
Next