- LABOR-LLM:基于大型语言模型的基于语言的职业表示
使用大型语言模型和迁移学习技术,本研究提出一种替代 CAREER 基础模型微调的方法,对下一个工作预测任务进行训练并展示了其在代表性调查数据上的预测性能优于传统计量模型、CAREER 和具有情境学习的大型语言模型。
- KDD关于全局特征影响解释的鲁棒性
我们研究了基于表格数据训练的预测模型的全局事后解释的健壮性。预测模型中预测特征的影响是模型调试和应用科学中的重要诊断工具,然而它们在面对数据和模型扰动时的脆弱性仍然是一个未解决的研究问题。我们引入了一些理论界限来评估偏依赖图和累积局部效应的 - 不同游戏中蒙特卡罗树搜索性能的表征
我们描述了一个初步的数据集,该数据集包括了 268,386 个不同游戏中的 61 个不同代理的对局,旨在研究 Monte-Carlo Tree Search 在各种游戏中的表现和改进方法,以及对数据集的预测模型训练和未来计划。
- 基于显著性模型解释的图形感知
通过实验设计研究可视化设计决策、对齐类型和显著性地图质量对人类感知显著性视觉解释的影响。
- 高效勘探规则集模型的拉肖蒙集合
本研究提出了一种高效的方法,可在有限的搜索中探索具有或不具有穷尽搜索的规则集模型的 Rashomon 集合。广泛的实验证明了所提方法在各种情况下的有效性。
- 在线营销中的深度提升建模基准测试
在线营销是许多工业平台和商业应用的关键,本文提出了一个用于深层提升建模技术的开放基准,并以可重复和统一的方式比较了现有模型的结果。结果显示,最新的工作在许多情况下与传统工作相比差异较小,并揭示了深层提升建模在泛化方面的局限性,特别是在不同的 - 调和模型多样性用于下游决策
我们提出了一个框架,通过多次校准预测模型以在下游决策问题中与真实概率分布无法区分来解决模型多样性问题,并通过实验验证了改进后的预测模型在减少下游决策损失和达成一致的最优响应行动方面的效果。
- 通过投注测试语义重要性:我敢打赌你并不是那个意思
我们的研究通过使用特征重要性、语义概念和条件独立性来形式化黑盒预测模型对于全局和局部统计重要性的定义,并通过顺序核化测试的方法对概念进行排序,从而在真实场景中提供了有效性和灵活性的框架。
- 基于回归神经网络(RNN)构建城市的温度预测模型
应用循环神经网络预测城市温度的研究与解决方案的综述。
- 机器学习中有效不确定性量化的共形预测方法的比较研究
过去几十年,数据分析和机器学习领域的大部分工作都致力于优化预测模型,并取得比现有模型更好的结果。然而,本文指出对于很多应用而言,更加重要的并非准确的预测,而是变异性或不确定性。本文进一步探讨了让每个人了解不确定性、意识到其重要性并学会拥抱而 - 朝向绿色夜晚:探索基于人工智能的光污染管理解决方案
通过数据科学和机器学习技术,本研究旨在通过跨学科的方法解决广泛存在的光污染问题。通过分析大量数据集和研究发现,我们的目标是开发能够预测不同地点和时间观察到的天空发光程度的预测模型。我们的研究旨在为基于证据的干预提供依据,并促进负责任的室外照 - 基于能量模型的准确 Shapley 值估计用于解释性深度学习预测建模
本文介绍了 EmSHAP(基于能量模型的 Shapley 值估计),它可以有效地近似预测模型在任意特征子集上的 Shapley 贡献函数的期望值。通过引入门控循环单元(GRU)将输入特征映射到隐藏空间,以消除输入特征排序的影响,并提出了动态 - 决策策略在混淆下的预测性能比较
我们提出了一种方法来比较决策策略的预测性能,该方法结合了因果推断和离线评估文献中的现代识别方法,并使用我们的框架在真实世界的医疗保险注册政策的预部署评估中进行了应用。
- 机器学习算法在代谢性肥胖手术术后成功率分类中的应用:一项全面的研究
代谢性肥胖手术属于肥胖症患者和相关健康问题的重要干预措施,通过一种新颖的机器学习方法对患者进行分类,研究揭示了不同模型和变量类型的有效性,为优化治疗策略提供了洞察力。
- 利用机器学习技术在阿根廷对糖尿病风险人群的首次识别体验
利用机器学习模型为阿根廷地区特定生成 T2D 和 PD 风险人群预测模型的发展和评估,证明了 RF、DT 和 ANN 方法在分类能力方面表现出色,为阿根廷地区的更复杂模型开发迈出了第一步。
- 不平衡分类中平衡方法的拉细幕效应实验研究
通过 Rashomon 效应研究平衡方法对预测多样性的影响,发现平衡方法会增加预测多样性并产生不同结果。为了在建模过程中负责任地监控性能和预测多样性之间的权衡,我们提出使用扩展性能增益图进行模型选择。
- 可靠的不确定性与便宜的神经网络集成:工业零件分类的案例研究
本研究比较了单一神经网络、深度集合和三种高效神经网络集合的性能,结果表明批量集合是一种性价比高且与深度集合相比在不确定性和准确性方面表现更好的替代方案。
- 一刀切” 不适用于所有情况:学习在语境中使用多少样本以提高文本分类效果
在这篇论文中,研究人员提出了一种新的自适应上下文学习 (AICL) 方法,通过预测分类器的 Softmax 后验概率来动态调整在推断中使用的示例数,以提高文本分类任务的性能。
- 关于神经架构搜索的延迟预测器
通过硬件感知的神经架构搜索,预训练和迁移学习方法来改进神经网络的部署效率,并提出了综合性的延迟预测模型,能够有效地提高硬件延迟预测的准确性。
- 利用图神经网络预测本地文化
该研究提出了一种图神经网络(GNN)方法,用于结合和评估关于社区内部特征、过去特征和群体流动的多个信息来源,从而在预测模型中提供更高的表达能力。通过探索来自 Yelp 的公共大规模数据集,我们展示了我们的方法在考虑结构联系以预测社区属性方面