- MLP-Mixer 作为一个宽且稀疏的多层感知机
本文研究了多层感知机,重点探究了其深化效果和改进方法。其中提出了 MLP-Mixer 与宽 MLP 具有稀疏权重的相关性,并从预测性能优化的角度进行了实验验证。
- 通过注意机制从基础和应用研究角度改进预测性能和模型可解释性
本篇论文探讨了深度学习模型预测过程黑盒化的问题,并以作者的博士论文为基础,重点讨论了近年来备受关注的注意力机制及其在提高预测性能和可解释性方面的潜力,以及关于在大数据集和实际应用中评估和推广的应用研究,最终总结了这些发现对未来研究和发展的启 - 利用定义提高论点背后人类价值预测 —— SemEval-2023 任务 4 上的 Epicurus
我们进行了实验,旨在识别论据背后的人类价值观,通过在模型训练过程中引入人类价值观的定义来提高预测性能,结果表明我们提出的模型相比于挑战组织者的基线模型表现更好,宏 F1 分数提高了高达 18%。
- DeepCAR 方法:预测具有变化点的时间序列数据
该论文基于深度学习提出了 DeepAR 框架,用于时间序列预测。针对 DeepAR 模型在时间序列中的拐点会降低其预测性能的缺点,本文提出了一种检测拐点并将其纳入模型的方法。实验证明,该方法在无拐点情况下与标准 DeepAR 表现相同,在有 - 带模型转移和适应的联邦射频指纹识别
本文提出了一种基于联邦学习算法的无线电频率指纹算法,采用模型转移和适应策略以及在卷积层之间引入密集连接,强化了学习精度并降低了模型复杂度,实现了通信高效和隐私保护,通过从一个信道条件转移学习模型并将其适应于其他信道条件,可以高度准确地预测在 - 使用变形金刚模型基于电子医疗记录预测阻塞性睡眠呼吸暂停的治疗费用
使用两个 Transformer 模型,结合患者足够长的访问历史和多种情境,预测阻塞性睡眠呼吸暂停患者接下来一年的访问费用,以帮助医疗决策者进行精细的财务管理和预算分配。
- DeepVARwT: 带有趋势的 VAR 模型的深度学习
本研究提出一种新的方法 DeepVARwT,利用深度学习模型 Long Short-Term Memory (LSTM)网络,在满足因果条件的情况下同时估计趋势和相关性结构,应用于预测领域并与先进的模型进行比较。
- MACFE: 基于元学习和因果推断的特征工程框架
该论文提出了一种基于元学习和因果特征选择的特征工程方法,名为 MACFE,通过预选择具有因果关系的原始特征来加速搜索,并在多个分类数据集上实验证明其可以显著提高预测性能。
- IJCAI电子健康记录中的累计停留时间表示用于医疗事件时间预测
研究了如何从电子健康记录中准确预测病症发展的时间点,提出了一种新的数据表征方法叫累积停留时间,使用神经网络构建可训练的累积停留时间表征,实验结果表明该方法能够有效提高预测准确率。
- IJCAI时空顺序超图网络在犯罪预测中的应用及动态多重关系学习
本文提出了一个能够共同编码复杂犯罪空间和时间模式以及不同类别犯罪语义关系的空间 - 时间序列超图网络,该网络采用超图学习范例,设计图结构信息传递架构,并引入多通道路由机制。通过实验证明了该方法的较强预测性能。
- 基于深度交叉注意力积网络的用户响应预测
本文提出了一种新的 DCAP 体系结构,通过多头注意机制和产品神经网络差异化重点交叉特征,并在三个现实世界数据集上进行全面实验,结果表明 DCAP 模型的预测性能优于现有模型。
- 解缠结信息瓶颈
本文从监督解缠角度实现信息瓶颈方法,引入 DisenIB,以最大压缩的方式坚持最大化压缩源,而不会损失目标预测性能。理论和实验结果表明,我们的方法在最大压缩方面是一致的,并在泛化、对抗攻击鲁棒性、超出分布检测和监督解缠等方面表现良好。
- 基于结构因果模型的领域自适应
论文利用结构因果模型来分析和比较了领域适应方法的预测性能,提出了一种新的 CIRM 方法,并提供了可复现的综合实验来说明该理论的假设在实践中的优势和不足。
- 使用图侧信息的离散值潜在偏好矩阵估计
提出了一种新的模型,该模型可以更好地利用图侧信息对个性化推荐问题进行建模并准确预测用户的评分,且该模型可以容纳任何离散值的潜在偏好矩阵和用户聚类,算法性能优于现有算法。
- WWW协同过滤中高效的神经交互函数搜索
本文提出了一种在协同过滤中搜索简单神经交互函数的方法,称之为简单神经交互函数(SIF)。实验结果表明,该方法比流行的自动机器学习方法更高效,可以获得比现有协同过滤方法更好的预测性能,并且可以为不同的数据集和任务发现不同的交互函数。
- 通过架构约束增强神经网络的可解释性
通过添加稀疏加性子网络、投影追踪以及平滑函数逼近等结构约束,本文提出了一种可解释的神经网络模型,具有良好的预测性能与模型解释性,同时导出了所提模型的必要和充分可识别条件,采用一种基于 backpropagation 算法计算导数和 Cayl - 注意力门控网络:学习在医学图像中利用显著区域
提出了一种新型的注意力门模型,可自动学习聚焦各种形状和大小的目标结构,在卷积神经网络模型中集成可以提高模型灵敏度和预测准确性并加速计算,应用于医学图像分类和分割任务中可提高模型预测性能并改进其启发机制。
- 基于场权重因子分解机的展示广告点击率预测
该论文提出了一种称为 Field-weighted Factorization Machines 的算法,以更加内存高效的方式建模不同领域之间的不同特征交互,实现点击率预测,并与其他算法进行了比较。
- Attention U-Net: 学习胰腺所在位置
该研究提出了一种新颖的关注门(AG)模型,用于医学图像处理,提高了 U-Net 模型的预测准确性和计算效率。
- 随机森林的超参数与调整策略
本文研究随机森林算法的超参数设置、影响因素与重要性,提出调优建议,推荐使用基于模型的优化策略,并提供 tuneRanger R 软件包实现自动调优。经过多个数据集的测试比较,与其他调优实现和默认参数的 RF 相比,tuneRanger 在预