- 基于随机矩阵理论的多任务回归分析及其在时间序列预测中的应用
我们提出了一个新的理论框架,将随机矩阵理论应用于高维非高斯数据分布下,为多任务回归提供准确的性能估计;我们通过将多任务优化问题形式化为一种正则化技术来使单任务模型利用多任务学习信息,并在线性模型的背景下导出了多任务优化的闭式解;我们的分析通 - ICML本地与全局可解释性:一个计算复杂性角度
使用计算复杂性理论评估机器学习模型的局部和全局解释性,证明了局部和全局解释之间的对偶性以及某些全局解释形式的独特性,并比较了线性模型、决策树和神经网络在计算解释复杂度方面的差异。
- 从一致预测到置信区间
利用一种名为 CCR 的新方法,通过使用模型输出的一系列符合预测间隔来建立模型参数的置信区间,创新地解决了模型参数置信区间构建中的挑战,并在有限样本情景下提供了覆盖保证。
- 从可能世界到可能模型:学习不确定数据
我们介绍了一种从不确定数据中学习线性模型的高效方法,其中不确定性被表示为数据中可能的变化集合,导致预测的多样性。我们的方法利用抽象解释和 zonotopes(一种凸多面体类型)来紧凑地表示这些数据集的变化,从而能够同时对所有可能的世界进行符 - 自注意力是否对时间序列预测有效?
我们介绍了一个新的架构,交叉注意力时间序列变换器(CATS),它通过消除自注意力并利用交叉注意力机制来重新思考传统 Transformer 框架,不仅提高长期预测精度,还减少参数和内存使用。大量对各种数据集进行的实验表明,我们的模型在最小均 - 用 DAG-Onion 方法改进因果发现的模拟验证
人工智能算法、因果发现、模拟设计、线性模型、有向无环图(DAG)
- FAIRM:通过极小极大优化实现算法公平性和领域泛化的不变表示学习
通过不变原则,我们提出了一个具有公平性和域泛化特性的基于训练环境的 FAIRM 方法,并在弱分布假设下提供了具有有限样本理论保证的实证 FAIRM。我们开发了高效的算法来实现线性模型中的 FAIRM,并展示了最小化最优性的非渐近性能。我们通 - 差分隐私线性模型在高维数据上的综述
通过综合评估不同的优化方法,本研究对高维度差分隐私线性模型的优化方法进行了广泛的回顾,并表明稳健且坐标优化的算法表现最佳,从而为未来的研究提供了重要参考。
- 线性时间序列预测模型分析
线性模型在时间序列预测方面表现出色,特征归一化改善了模型泛化能力;分析了可使用这些线性模型体系结构表示的函数集合;证明了几种流行的线性模型变体等效于标准的无约束线性回归;每个模型可以重新解释为在适当增强的特征集上的无约束线性回归,因此在使用 - 基于三重 / 无偏 Lasso 的条件平均处理效应的统计推断
研究调查了特定个体因果效应的度量 —— 条件平均处理效应(CATE)的估计和统计推断方法,使用线性模型定义 CATE 为这些线性模型的预期结果之间的差异,并通过高维线性回归方法进行一致性估计和统计推断,进一步使用双重 / 无偏机器学习(DM - 学习最小方差特征通过标签增强
我们分析了标签增强方法在模型训练中的作用,证明了采用标签增强的线性模型仅仅学习数据中的最小方差特征,而标准训练则能够学习到更高方差的特征。我们的结果表明,与标准训练相比,标签平滑和 Mixup 在对抗性扰动下对训练数据的鲁棒性较差。通过对合 - 使用任意预测变量的线性回归参数有限样本置信区间
使用任意预测模型构建置信区间,不依赖于噪音模型并可扩展至非严格线性函数,采用混合整数线性规划框架进行优化和参数坐标的置信区间提取,适用于假设检验,并通过合成数据验证了方法的实证适用性。
- ConvConcatNet: 从 EEG 中重建 Mel 频谱的深度卷积神经网络
利用神经网络和深度卷积神经网络方法,本研究提出了一种重建脑电图中语音信号的新方法 ConvConcatNet,其中利用深度卷积神经网络和广泛的拼接操作相结合。在我们的 ConvConcatNet 模型中,重建的梅尔频谱图与目标梅尔频谱图之间 - 线性上下文强化学习最佳方案
该研究探讨了在对抗性破坏下的 K 臂线性上下文赌博问题,并提出了一种在随机和对抗环境下具有理论保证的名为最佳两全(BoBW) RealFTRL 的策略。
- 时空线性:面向通用多元时间序列预测
复杂多元时间序列预测中,通过简单的线性模型结构来整合时间嵌入和空间信息的 SpatioTemporal-Linear 框架优于深度学习技术中的线性模型和 Transformer 模型在多种观测和预测时长的数据集上的性能表现。
- 虚假数据对电化学中的机器学习模型的影响
选择适合处理噪声数据的机器学习模型以及建立叠加模型是否确实对原本对噪声敏感的弱模型提供鲁棒性。线性模型对噪声处理良好,但在预测准确性方面存在问题;基于树模型对噪声处理能力较差,但可以提供更高的预测准确性;叠加模型既具备高准确性又能有效处理噪 - 基于注意力的多实例混合模型
GMIL 是一种整合广义线性混合模型(GLMM)和多示例学习(MIL)的框架,利用预定义的细胞嵌入增强计算效率,揭示了单细胞数据中的新关联和揭示了不同领域的生物学机制。
- 对抗训练线性回归的正则化性质
最新机器学习模型存在脆弱性,而对抗训练是一种有效方法,本研究着重探究线性模型下的脆弱性,并对对抗训练在线性回归和其他正则化方法中的解决方案进行了比较分析。
- 自适应线性模型的统计限制:低维估计与推断
使用自适应数据收集的估计和推断在统计学中面临重大挑战。通过研究单个坐标估计的错误表明了适应性数据和 i.i.d. 数据之间估计性能的显著差异。研究表明 OLS 方法可实现匹配的估计错误,我们还提出了一种新的单坐标推断估计器,通过解两阶段自适 - CORE: 分布式优化的通用随机重建算法及可证明低通信复杂度
基于 Common randOm REconstruction (CORE) 技术,本研究提出了一种可以压缩传输信息、降低通信复杂度的分布式机器学习算法,并通过应用于线性模型和非凸优化等分布式任务,设计了新的具有更低通信复杂度的分布式算法。