小型印记深度学习的结构变换

NIPSOct, 2015

Structured Transforms for Small-Footprint Deep Learning

Vikas Sindhwani, Tara N. Sainath, Sanjiv Kumar

TL;DR提出了一种基于低位移秩概念的结构化变换方法，能快速优化深度学习模型在储存和功耗受限移动设备上的部署，通过参数共享的各种配置实现结构化到非结构化的统计建模，并在关键词检测应用中显著提高推理速度和轻量化程度，表现优于目前的技术。

Abstract

We consider the task of building compact deep learning pipelines suitable for deployment on storage and power constrained mobile devices. We propose a unified framework to learn a broad family of structured param

deep learning mobile devices low displacement rank parameter sharing keyword spotting

发现论文，激发创造

低位移秩学习压缩变换

通过更一般化的位移操作，显式地学习两个位移算子和低秩分量，设计出一种新的 LDR 矩阵，并证明其在多层神经网络的 VC 维度上具有较好的界限，有效地降低模型复杂度。实验结果表明，该设计可以优于现有的压缩方法，并使用的参数数量比一般非结构化网络少 20 倍以上。

Oct, 2018

结构化模型中的低秩约束用于快速推理

本文提出一种简单的方法，通过将中心推理步骤视为矩阵向量积并使用低秩约束，以降低大类结构模型的计算和内存复杂度。使用神经参数化结构模型进行语言建模，多声部音乐建模，无监督语法归纳和视频建模的实验表明，我们的方法与大型状态空间的标准模型具有相同的准确性，同时提供了实际的加速。

Jan, 2022

利用小型模型的多维深层结构状态空间方法进行语音增强

本文提出了一种多维结构化状态空间（S4）方法来增强语音，将多维的 S4 层进行白化变换以更好地捕捉跨频率轴的频谱依赖性，探索了几种基于 S4 的 T 和 TF 深层结构，其中，在 TF 领域中，与基于卷积层的传统 U 型模型相比，所提出的 S4 模型尺寸缩小了 78.6％，但在数据增强的情况下仍然达到了竞争性结果，具有较好的 PESQ 分数。

Jun, 2023

在高效基础上构建：利用结构化前馈层有效训练 LLMs

通过结构化的前馈网络，使用线性层近似来减少大型语言模型的参数数量和计算成本，同时提出一种自我引导训练的方法来改善这种近似所表现出的训练动力学，从而在训练和推断中实现高效和有效的结果。

Jun, 2024

模型压缩的结构化多哈希技术

本文介绍了一种基于哈希和降维的结构化多哈希方法，可用于控制任何深度网络的模型大小，从而大幅减少可学习变量且依旧保持较高的精度。作者在 ResNet，EfficientNet 和 MobileNet 等结构中进行了压缩，并且在 CIFAR10 数据集上仅损失 10％而使 ResNet32 模型减少了 75％。

Nov, 2019

LLM 外科医生

通过数据驱动的预训练模型压缩方法，我们可以在不牺牲性能的情况下，对大型语言模型进行剪枝，减小模型的规模。

Dec, 2023

可分离层使结构化有效线性替换成为可能

本文表明，使用结构化线性分解替换点积卷积中的线性元素不仅更高效，而且还提供了在效率 / 准确性方面的达成帕累托最优的成果。

Jun, 2019

非线性输出转换的深度结构化预测

本研究提出一种新型模型，可用于语义分割等任务中，综合多种现有方法，实现了图像分割中非线性输出空间转换，同时保持了现有推理技术的适用性。

Nov, 2018

结构化演化与紧凑体系结构的可扩展策略优化

采用结构化随机正交矩阵的梯度逼近黑盒优化方法可以学习到比标准梯度估算技术更好的紧凑策略，从而提高了在资源有限的实际硬件上的速度和可伸缩性。

Apr, 2018

参数高效微调的结构化无限秩矩阵

使用结构化无限秩矩阵 (SURM) 作为适配器和 LoRA 的替代方法的参数高效微调 (PEFT) 可以在减少参数数量的同时显著提高图像分类任务和 GLUE 基准上的质量。

Jun, 2024