- 筛选噪声:扩散概率模型及其在生物分子中的应用调查
扩散模型在生物分子结构、序列的预测和设计方面的应用所取得的重要成果以及在生成和预测任务中的角色。
- LM-IGTD:用于二维图像生成的低维和混合类型表格数据,以发挥卷积神经网络的潜力
该研究提出了一种将表格数据转化为图像的新方法,名为 LM-IGTD,通过整合随机特征生成过程和 IGTD 的修改版本,实现了从表格数据中创建图像的自动化和可解释的端到端流程,并在 12 个低维和混合类型数据集上进行了广泛的评估,通过 LM- - 释放大型语言模型在数据科学中预测表格任务的潜力
利用大型语言模型(LLMs)解决数据科学中与表格数据相关的预测任务的研究,通过创建一个包含注解指令的综合数据集来对 LLM 进行大规模训练,研究应用训练好的模型在零样本预测、少样本预测和上下文学习场景中的实际应用,并通过实验证明该方法在表格 - 多关系图神经网络用于领域外链接预测
在这项研究中,我们针对动态多关系图提出了一种新颖的 Graph Neural Network 模型,名为 GOOD,它通过新颖的多关系嵌入聚合设计解决了域外泛化问题,并在两个零售领域提出了五个基准测试,证明 GOOD 能有效地预测出已知关系 - SatCLIP:卫星图像中的全球通用位置嵌入
Satellite Contrastive Location-Image Pretraining (SatCLIP) is a global geographic location encoder that provides vector - 多模态、多任务、可解释的模块化网络
MultiModN 通过融合多种数据类型的潜在表示,提供了对多个预测任务的实时反馈,解释性好且对缺失数据具有鲁棒性,同时不影响性能。
- 中小企业和大型企业财务绩效管理的预测人工智能
提供新的金融和宏观经济比率以及监督学习模型(ML 回归器和神经网络)和贝叶斯模型预测公司绩效,并发现这些新的变量与行业标准比率结合使用可以提高模型准确性。Feedforward 神经网络(FNN)在 6 个预测任务中(ROA、ROE、净利润 - ICLRManyDG:面向医疗应用的多领域泛化
通过相互重构和正交投影步骤,提出了新的域泛化方法 ManyDG 来解决医疗保健任务中患者特征数据对模型训练的影响问题,实验表明该方法可以显著提高多个真实世界医疗保健任务的泛化性能。
- 针对细粒度因果推理和问答的探索
本文介绍了一种新的精细化因果推理数据集,并在自然语言处理中提出了一系列新的预测任务,例如因果检测、事件因果提取和因果问答。作者通过大量实验和分析表明,数据集中的复杂关系对最先进的方法带来了独特的挑战,并强调了潜在的研究机会,特别是在发展 " - 退役成年人:公平机器学习新数据集
通过重构 UCI Adult 数据集并衍生新的预测任务,本篇论文扩展现有的数据生态系统,为公平机器学习研究拓宽了数据来源,通过对新数据集的分析,研究者可以深入探讨公平性准则、算法干预的表现和分布变化的影响。
- 有损压缩用于无损预测
本文利用无监督目标设计神经压缩器进行图像压缩,以满足具有数据增强特征的所有预测任务的高性能,实现了大幅度节省数据率的效果,同时不会降低下游分类性能。
- 非参数特征影响与重要性
该论文提出了特征重要性和特征影响的数学定义,并通过局部依赖曲线直接在数据上对其进行评估,证明其在预测任务中与现有特征选择技术具有竞争力。
- ICML视觉表示对比学习的简单框架
SimCLR 是一种简单的对比学习框架,通过定义有效的预测任务、引入可学习的非线性变换以及使用大型批次和更多的训练步骤来提高对比学习的效果,在 ImageNet 数据集上实现了比以往方法更好的自监督和半监督学习结果。
- CryptoNN:在加密数据上训练神经网络
提出了一种名为 CryptoNN 的框架,该框架使用功能性加密方案来支持加密数据上的神经网络模型的训练,以解决神经网络模型训练过程中的隐私问题,并显示出与 MNIST 数据集上基线神经网络模型相似的准确性。
- ACL临床笔记的注意力分析用于预测任务
本研究使用两个电子病历文本库和四个预测任务,探索了注意机制在神经模型中的作用,发现注意机制的加入有望提高模型性能,但对预测的支持意义尚不明确。
- ICML通过锚定相关性解释实现可解释的主题发现
使用模糊和非正式的专家知识指导文本中解释性潜在主题的发现,结合了信息瓶颈和总相关性解释方法,对 Anchored CorEx 进行了初步评估,并在两个不同的语料库上产生了更连贯和可解释的主题。