- 神经网络的自适应切线特征视角
为了更好地理解神经网络中的特征学习,我们提出了一个在切线特征空间中理解线性模型的框架,其中特征在训练过程中被允许进行转换。我们考虑特征的线性变换,得到了一个在参数和变换上具有双线性插值约束的联合优化问题。我们证明了这个优化问题等价于一个线性 - 线性化神经网络的六堂课
从线性模型分析多层神经网络的行为,并回顾其与线性模型之间的对应关系,以及线性化神经网络的四种模型:线性回归、核岭回归、随机特征模型和神经切线模型,以及线性理论的局限性和其他方法如何克服这些局限性。
- 聚类线性情境强化学习与背包
本文研究了集群上下文强化学习,其中回报和资源消耗是集群特定线性模型的结果,算法无法知晓各个元素的集群成员关系。通过拉动一根臂在一个时间段内会产生回报和对于多个资源的消耗,并且任何资源的总消耗超过约束条件会导致算法终止。因此,最大化总回报需要 - 线性模型和两层线性卷积神经网络中批归一化的隐式偏差
本论文研究了批归一化在梯度下降中的隐性偏差,证明了学习用批归一化的线性模型进行二进制分类时,梯度下降会以 $exp(-Ω(log^2 t))$ 收敛到训练数据上的均匀边缘分类器。这将批归一化的线性模型与不带批归一化的模型区分开来,其隐性偏差 - 没有独立性的泛化误差:去噪、线性回归和迁移学习
本文探讨了线性模型在实际数据中的泛化能力,并提出了一种在非独立同分布数据和分布变化情况下的解决方法,得到了渐近精确的理论结果,并在实际数据验证了结果的有效性。
- 打破可解释深度学习的悖论
该研究提出了一种使用新方法训练的深度超网络来生成可解释的线性模型的方法,以保留黑匣子深度网络的准确性并提供自由的可解释性,而需要与黑匣子深度模型相同的运行时和内存资源,实现了实用性,实验结果表明,该可解释的深层网络在表格数据上与最先进的分类 - 展开所有 ReLU 网络
本篇论文阐述了深度 ReLU 网络可以分解成输入空间划分的区域内的线性模型集合,并将该理论推广到图神经网络和张量卷积网络等复杂网络上。此外,该论文证明了神经网络可以被理解为可解释的模型,如多元决策树和逻辑理论,并展示了该模型如何导致便宜且准 - Mlinear:重新思考时间序列预测中的线性模型
本文提出了一种基于线性模型的高效时间序列预测模型,其核心组成部分包括:(1)将单通道和多通道数据的不同语义进行集成,对数据进行联合预测;(2)使用一种新的损失函数来替代传统的 MSE 和 MAE 损失以达到更高的预测精度。在广泛使用的基准时 - TSMixer: 一种基于全 MLP 的时间序列预测架构
本文研究线性模型在时间序列预测中的能力,提出了一个基于多层感知机的模型 TSMixer,通过在时间和特征维度上的混合操作提取信息。TSMixer 在常见的学术基准测试中表现出和专业模型类似的性能,在真实世界的 M5 基准测试数据集上表现出比 - CHiLL: 利用大型语言模型从临床笔记中进行零 - shot 定制可解释特征提取
本研究提出使用大型语言模型来进行零样本特征提取并为医学性风险预测模型提供高层次的自然语言特征选取方法,通过自动化特征提取,不需要手动从原始电子病历中提取特征,提供与参考特征相媲美的性能,同时提高了模型的可解释性。
- 基于实例的 AXIL 加权梯度提升机预测解释
研究表明,线性模型和基于树的模型的回归预测可以表示为训练数据中目标实例的线性组合,并且使用的权重是实例重要性的度量,这有助于使机器学习预测更可解释和可解释性。
- ICLR基于采样的大型线性模型推断,应用于线性化拉普拉斯
引入可扩展的基于样本的 Bayesian 推断方法、匹配的超参数选择方法和经典特征归一化方法,以解决线性化神经网络推断中的计算成本限制和先前突出的路径学问题,从而在 CIFAR100、Imagenet 和高分辨率层析成像重建任务中实现线性化 - 一个集成的多智能体系统用于非线性分类
smapy 是一种基于集成学习和自适应多智能体系统的移动性预测实现方案,并提出了一种详细的方法,通过系统的合作学习方法的使用,证明可以在非线性分类环境下使用线性模型,并在交通模式检测数据集上实现了良好的表现。
- ICLR通过生成函数看小批量随机梯度下降法:收敛条件、相变、从负动量中受益
本文提出了一个新的分析框架来研究 mini-batch SGD 对于具有常数学习率、动量和批次大小的线性模型的噪声平均属性,探讨了问题的谱分布对算法的影响,并验证了使用负动量可以实现最优收敛速率的理论预测。
- Transformer 在时间序列预测中是否有效?
通过简单的线性模型实验发现在长期时间序列预测任务中,线性模型 LTSF-Linear 的效果优于复杂的基于 Transformer 方法,这引发人们对该任务以及其他时间序列分析任务中基于 Transformer 方法的有效性的反思。
- PatClArC:使用模式概念激活向量进行噪声鲁棒性模型调试
本文介绍了一种名为 PCAV 的模式概念激活向量,用于在潜在空间中实现噪声鲁棒的概念表示,并证明了基于模式的人工建模对 CAVs 的应用具有有益的影响。
- 高斯 DAG 模型的最优估计
研究从观测数据中学习 Gaussian 有向无环图(DAG)的最佳样本复杂度,证明了在相等方差的情况下,学习有向图形模型与学习无向图形模型具有相同的最佳样本复杂度
- ICML线性上下文强化学习模型选择的通用自适应算法
在上下文强化学习中进行模型选择是一项重要的补充问题。本研究提出了一些新的算法,这些算法可以在数据自适应的情况下进行探索,并提供模型选择保证。
- 广义记忆近似信息传递
提出了一种通用广义记忆近似消息传递(GMAMP)框架,包括现有的正交 AMP/VAMP、GVAMP 和 MAMP 作为特殊实例,并构建了一种基于低复杂度记忆线性估计器的贝叶斯最优 GMAMP(BO-GMAMP)算法,可用于 GLM 信号重构 - 基于会话的线性物品模型用于推荐
本文提出了简单而有效的线性模型,以考虑会话中前一项序列,以提高会话推荐的质量,并为反映不同角度的会话数据提供了一个广义框架。此外,由于我们的模型可以通过封闭形式的解决方案来解决,因此它们具有可扩展性, 实验结果表明,提出的线性模型在几个真实