BriefGPT.xyz
大模型
Ask
alpha
关键词
linear projection
搜索结果 - 3
文本到图像生成模型中的构成问题的理解和减轻
通过研究基于组合性失败模式,我们发现文本到图像生成模型中 CLIP 文本编码器的文本条件不完备是无法生成高保真组合场景的主要原因,并提出仅通过在 CLIP 表示空间上学习简单的线性投影可以实现最佳组合性改进,同时不降低模型的 FID 分数。
PDF
22 days ago
层归一化的几何和动力学
一篇技术说明旨在提供对深度神经网络中常见的 LayerNorm 函数更深入的直观理解,通过开发新的数学表达和几何直觉,使其净效应更透明,强调当 LayerNorm 作用于 N 维向量空间时,所有 LayerNorm 的结果位于 (N-1)
→
PDF
2 months ago
通过矩阵分解的视觉 Transformer 剪枝
通过使用矩阵分解实现视觉转换器修剪,该论文进一步在保留重要特征的基础上,比较了多种矩阵分解方法,最终选择奇异值分解作为降维和计算复杂度减少的方法,通过与原准确率得分进行比较实现目标。
PDF
10 months ago
Prev
Next