Apr, 2024
InternLM-XComposer2-4KHD: 处理从 336 像素到 4K 高清分辨率的创新大型视觉语言模型
InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4K HD
Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Bin Wang...
TL;DRInternLM-XComposer2-4KHD 是一项具有里程碑意义的研究,通过引入动态分辨率和自动分片配置的新方法,将 LVLM 的分辨率能力提升到 4K HD 并在多个方面取得了卓越的性能提升。