Dec, 2023

调整 Attention 中的 LayerNorm:朝着高效的多模态 LLM 微调

TL;DR将大型语言模型(LLMs)转换为多模式大型语言模型(MLLMs)的有效策略,通过调整 LayerNorm 来实现性能提升和模型表现力改善。该策略相较于其他调整方法具有高效性,同时进一步使用对话数据进行选择性调整能够提高效率。