- 利用联邦学习和差分隐私对电子健康档案进行隐私保护的机器学习
电子健康记录(EHR)是医疗提供者用来存储患者的医疗记录的电子数据库,其中可能包括诊断、治疗、费用和其他个人信息。机器学习算法可用于提取和分析患者数据以改善患者护理。患者记录包含诸如社保号码和居住地址等高度敏感信息,因此需要使用联邦学习和差 - 信用归因与稳定压缩
我们研究机器学习算法对信用归因的问题,提出了新的定义 —— 对差分隐私进行放松,以使得某些数据点的稳定性保证降低,这些数据点可以在得到数据所有者的许可下非稳定地使用,可能会有对其进行补偿,同时其他数据点对算法的输出没有显著影响。我们在 PA - ICML贝叶斯数据选择
将数据选择作为决策问题,并通过导出相应的贝叶斯准则为半监督学习中的自我训练等问题提供了贝叶斯最优选择数据的方法。根据模拟和真实数据的实证评估,我们进一步展示了该准则在广义线性模型、半参数广义加性模型和贝叶斯神经网络上减轻了确认偏差的问题。
- IJCAI基于生物标志物的癌症分类,使用经过预训练模型的集成
通过非侵入式方法,液体活检能够检测和监测特定生物标志物,提高医疗干预的精确性和效能,利用超快模型进行癌症分类,并结合超快模型、XGBoost 和 LightGBM 提出了一种新的集成模型用于多类别分类任务,仅使用 500 个主成分特征即可实 - 自然语言处理在金融风险检测中的应用
应用自然语言处理(NLP)技术在金融风险检测方面的研究,构建了一个基于 NLP 的金融风险检测模型,旨在识别和预测金融文件和通信中的潜在风险。通过实证研究验证,该模型在风险识别和预测方面表现出色,并为金融机构提供有效的风险管理工具。该研究利 - 机器学习在医疗中的公平性教程
在临床决策和预防现有医疗不公平中确保机器学习算法在所有患者群体中安全有效,不会对特定患者造成不利影响,对于医学信息学社区非常重要。本教程的目标是向医学信息学社区介绍机器学习中的公平常见概念,重点关注临床应用和实际实施。
- 关于公平感知分类器的最大局部差异
通过提出一种称为最大累积比不平等的新公平度量指标(MCDP)来衡量算法的最大局部不平等,提供比传统公平度量更准确和高效的计算方法,并通过不可导逼近的 MCDP 的优化算法提高算法公平度。在基于表格和图像的数据集上进行的广泛实验验证了我们的公 - 模糊卷积神经网络用于表格数据分类
本研究通过提出的模糊卷积神经网络(FCNN)模型对表格数据进行分类,通过实验证明该模型在学习有意义的表征方面表现出竞争性或优越性能,为结构化数据分析提供了新的机会。
- LLM 动态自适应特征生成
通过采用大型语言模型和特征生成提示的新方法,我们提出了一种动态自适应的特征生成方法,提高了特征生成过程的可解释性,并扩展了在各种数据类型和任务上的适用性,相比现有方法具有更高的策略灵活性。一系列实验证明我们的方法明显优于现有方法。
- 心灵的表情:通过面部表情揭示在 11,427 名青少年中的心理健康状态
通过分析大规模的面部表情数据集,本研究揭示了情绪障碍与面部表情之间的关系,发现了面部表情中微小的瞳孔动态和视线方向变化可能是情绪障碍的潜在标记,为基于数据的精神健康研究奠定了基础。
- 生物神经元和深度强化学习在模拟游戏世界的样本效率上竞争
生物系统与机器学习算法在完成任务所需样本数量上有何比较?通过将体外生物神经网络与最先进的深度强化学习算法在 “乒乓球” 游戏的简化模拟中进行学习效率对比,发现即使是简单的生物培养物在真实时间课程下,也比所有深度强化学习代理在各种游戏性能特征 - KDD在线深度学习的机遇与挑战教程回顾
机器学习算法在当今世界中变得不可或缺,支持和加速我们根据手头数据做出决策的方式。本文回顾了在 ECML PKDD 2023 上举办的我们的在线深度学习机会与挑战教程,并简要概述了在在线学习环境中应用神经网络的机会和潜在风险,其中使用了 Ri - 音乐类型分类:训练一个 AI 模型
通过使用机器学习算法和从音频信号提取的特征进行音乐流派分类,本研究旨在评估机器学习模型在流派分类中的鲁棒性并进行结果比较。
- 高对比度光谱学中的机器学习用于外行星探测:将互相关图和深度学习应用于中分辨率整体场谱
通过使用监督深度学习算法,将光谱和空间维度相结合,我们开发了一种新的方法,以提高积分场谱学(IFS)数据集的高对比度外行星的检测灵敏度。在将光谱维度转化为径向速度维度后,机器学习算法的真阳率受径向分离变化的影响较小,能够减少误报并提高对直接 - DispaRisk: 数据集中不平等风险的评估和解释
介绍 DispaRisk,这是一种新颖的框架,旨在在 ML 流程的初期阶段,主动评估数据集中差异的潜在风险。通过与公平研究中常用的数据集进行基准测试,我们发现 DispaRisk 能够识别具有高歧视风险、易受偏见影响的模型家族以及增加 ML - 分布式无回退优化算法在 Stiefel 流形上的全局收敛性
该研究论文提出了一种名为 DRFGT 算法的去中心化、无在附近退缩更新的梯度跟踪算法,展示了与基于集中式、基于退缩的方法相同的收敛速率,并通过数值实验证明 DRFGT 在计算开销大大减少的情况下与最先进的基于退缩的方法性能相当。
- MM量子分类器的对抗鲁棒性保证
通过使用量子机器学习算法,研究结果表明对抗性攻击具有一定的量子保护性,能够提供对机器学习算法的鲁棒性,使其对数据扰动、局部攻击和普遍对抗性攻击具有一定的保护能力。
- 时间序列模型的联合预测区域
应用机器学习算法构建预测区间是一个具有挑战性的问题,特别是在时间序列上。本研究实现了 Wolf 和 Wunderli 的方法来构建联合预测区间,并与其他方法进行比较。该方法基于自助法,并应用于不同的数据集和预测器。研究结果显示,强预测器(如 - 塑造财务成功的因素:深入研究影响变量
探索机器学习算法和方法在个体金融成功中所发挥的各种社会经济因素,以理解和揭示影响金融成功的真正决定因素,其中包括最高学历、职业、性别、年工作小时、年龄和工作资历等。
- 机器学习在医疗领域的样本选择偏差
机器学习算法在个性化医学中具有潜力,但其临床应用仍受到限制。研究表明,样本选择偏差(SSB)是限制其采用的一个关键因素。本研究通过检验 SSB 对机器学习算法性能的影响,指出了潜在的风险,并提出了一种新的研究方向,该方向基于目标人群的识别而