- 在机器学习项目中,通过偏差检测拓展具有可变性感知的模型选择
该论文描述了将一个具有偏差检测的自适应可变性感知模型选择方法扩展到机器学习项目中的工作,该方法通过使用基于文献中提出的启发式方法的特征模型来对影响模型选择的因素的可变性进行建模,并在一个特定的案例研究中进行实验证明了该方法的有效性,并为机器 - 数据科学中的 GPT:模型选择的实践探索
利用大型语言模型 (LLMs) 管理结构化数据并增强数据科学流程的兴趣日益增长。尽管具有潜在的好处,但其整合引发了对可靠性和决策方法的重要问题,强调了模型选择过程中包括数据性质、问题类型、性能指标、计算资源、可解释性与准确性、对数据的假设以 - 超维变换在分布建模、回归和分类中的应用
超维计算 (HDC) 是一种具有巨大潜力的计算范例,尤其在机器学习和数据科学领域引起了广泛关注。本文介绍了超维变换的理论基础,并展示了其在机器学习中的应用,包括回归、分类、统计建模等方面。
- 如何在小数据情况下进行机器学习?—— 一份来自工业角度的综述
人工智能在科学、工业和日常生活中经历了技术突破,小型数据的机器学习在数据科学和应用中扮演着重要角色,机器学习在小型数据的工业应用面临五个关键挑战:无标签数据、不平衡数据、缺失数据、不足数据和稀有事件。
- 社会公益的数据科学
我们提出了一个 “数据科学为社会福祉”(DSSG)研究框架,考虑了相关数据科学研究流派、社会福祉挑战和不同层次的社会技术抽象之间的相互作用,并通过文献分析实证证明了在信息系统(及其他相关学科)中关于 DSSG 的工作缺乏,并强调当前的阻碍因 - 自动化数据分析的轻量级知识表示
数据科学的主要目标是从数据中获取有意义的信息,本文尝试自动化数据分析的关键性环节,并通过实现数据分析方法和建立领域特定知识的链接,以及验证功能,为全自动数据分析铺平道路。
- 数据科学、机器学习和人工智能数据源总览
数据科学、机器学习和人工智能的最新进展,如大型语言模型的出现,正在导致对可由这些模型处理的数据的不断增加需求。尽管数据来源是应用特定的,而且不可能提供详尽无遗的数据来源清单,但提供一份涵盖多个应用领域的(必然不完整的)数据源列表或综合手册仍 - 土壤采样点最佳选择的深度学习框架
通过利用深度学习在图像处理方面的最新进展,本研究提出了一种基于自注意力机制的编码 - 解码架构模型,用于自动选择土壤采样点,并在土壤采样数据集上实现了优于传统卷积神经网络方法的令人印象深刻的结果。
- 基于人工智能的软件和系统架构框架:以智能的网络物理系统为焦点
本研究通过建立适应现代应用和组织要求的架构框架,针对数据科学和机器学习相关的利益相关者的需求,提出了用于评估和基准测试 ML-enabled CPS 的标准以及支持用户进行建模和开发管道的工具评估的标准。通过文献回顾、专家访谈和在线问卷调查 - 数据科学项目的失败原因
数据科学是一种现代数据智能实践,它是许多企业的核心,并帮助企业更高效地建立智能策略以应对业务挑战。
- 数据科学的价值观:数据科学的本质、价值和风险
数据科学是一个具有无限广泛的范围、规模、复杂性和能力的研究范式,通过知识发现在各个学科中广泛应用,具有巨大的潜力和风险,并将带领我们进入对世界的新认知方式。
- 药物发现领域的人工智能:现在已经到达了吗?
药物发现正在适应新技术,如数据科学、信息学和人工智能(AI),以加速有效治疗的开发,同时减少成本和动物实验。 AI 正在改变药物发现的方式,成功的药物发现需要优化与药理动力学、药代动力学和临床结果相关的特性。本文讨论了 AI 在药物发现的三 - 数据科学教育应如何处理大型语言模型?
大型语言模型 (Large Language Models, LLMs) 的迅猛发展正在革新数据科学和统计学,该论文旨在探讨 LLMs 对于数据科学教育的潜在机遇、资源和挑战,以及其在数据科学中的作用转变和创造性应用。
- 人才分析的人工智能技术综述
在人力资源管理领域,我们提供了一份关于人工智能技术在人才分析方面的综合调查,首先提供了背景知识和分类相关研究努力,然后根据三种应用驱动场景对其进行了综合分类,最后总结了 AI 驱动的人才分析在未来研究方向的挑战和潜在前景。
- 高性能数据框架的并行处理模式深度分析
本文介绍基于高性能计算的分布式 DataFrame 操作常见模式和成本模型,同时评估了 Cylon 在 ORNL Summit 超级计算机上的性能表现。
- 利用决策建模挽救数据科学
本文提倡数据科学领域采用 AI 中的贝叶斯方法以建立一个新的应用研究方案,其中包含六个决策质量原则,称为 “决策建模”,并以 ROC 曲线和效用模型为例。
- 定义数据科学:一门新的探究领域
该研究针对数据科学多重定义的挑战,提出基于数据科学参考框架的一致、统一的定义,并提供了必要的数据科学工件候选定义。
- 人工智能与辐射防护:革新还是更新?
介绍机器学习在辐射防护中的应用,探讨人工智能的潜在优势与伦理难题,提出辐射防护专业人员和数据科技专家合作是提高科学技术成果有效性的关键。
- 机器学习时代的官方统计数据源变更
本文旨在介绍与数据源变化相关的机器学习应用于官方统计数字时存在的主要风险、责任和不确定性,并提供一份最普遍的变化数据源的清单、更加健壮的数据来源和检查技术、以及全面监测等预防措施,以确保基于机器学习的官方统计数字具有完整性、可靠性、一致性和 - UK 中小企业数据驱动决策的趋势和挑战:对 85 家中小企业分析的案例研究和经验教训
本文介绍了基于英格兰西米德兰兹地区的 85 个中小型企业的案例研究,旨在解决中小企业在数据驱动决策制定方面面临的趋势和挑战,讨论了数字化、人工智能和机器学习等技术带来的机遇和挑战。