- 基于社交媒体的可解释人工智能用于精神障碍检测:调查与展望
通过在线社交媒体进行的人工智能驱动的心理障碍检测与解释性人工智能的最新发展,为精神卫生保健提供了全面的概述,旨在指导研究人员、从业人员和决策者发展心理障碍检测领域。
- 可解释的人工智能的数据科学原理
社会对算法问题解决的能力前所未有地增强。人工智能如今应用于更多的领域,这是强大的抽象化、丰富的数据和易于使用的软件的结果。随着能力的扩展,风险也增加了,因为模型常常在没有完全理解其潜在影响的情况下部署。可解释且交互式的机器学习旨在使复杂模型 - 机器学习中因果推断简介
这篇研究论文旨在介绍数据科学中的因果推理对机器学习的重要性,包括因果推理的原则、机器学习的应用,以及与之相关的扩展视野和知识,特别关注机器学习中的分布外泛化问题。
- 数据女权主义与人工智能
通过引入新的原则并与环境影响和同意相关,本文在探讨为进行公平、道德和可持续的 AI 研究而提出的交叉女权主义原则的基础上,阐述了女权主义对 AI 研究的重要性,并旨在解决 AI 研究中不平等、非民主、剥削和排斥力量,预防不安全、歧视或压迫性 - 计算社会科学和人工智能研究中的隐私嵌入
保护隐私是计算社会科学、人工智能和数据科学等领域中的重要问题,本文讨论了隐私的角色和研究人员在这些领域可能面临的主要问题,并提出了保护参与者隐私的若干重要考虑因素。
- 朝向绿色夜晚:探索基于人工智能的光污染管理解决方案
通过数据科学和机器学习技术,本研究旨在通过跨学科的方法解决广泛存在的光污染问题。通过分析大量数据集和研究发现,我们的目标是开发能够预测不同地点和时间观察到的天空发光程度的预测模型。我们的研究旨在为基于证据的干预提供依据,并促进负责任的室外照 - AI 解码:ChatGPT 中数据分析的内幕故事
最近人工智能生成技术的快速发展使得数据科学领域发生了各种变化。本文批判性地审查了 ChatGPT 在广泛任务中的数据分析能力,尽管数据分析为研究者和实践者提供了前所未有的分析能力,但它远非完美,重要的是要认识和解决它的局限性。
- 粗路径讲义及其在机器学习中的应用
这些笔记阐述了最近在数据科学和机器学习中使用签名变换和粗略路径理论。我们从第一原理发展了签名的核心理论,然后概述了一些最近流行的应用,包括基于签名的核方法和神经粗略微分方程。这些笔记是基于两位作者在伦敦帝国学院的课程。
- 嗅觉中的数据科学
神经感知技术的进展使得我们能够以极大的细节观察嗅觉过程。本文从数据科学和人工智能的角度概念化嗅觉,将气味物质的特性与其在嗅觉系统中自鼻子到大脑的感应和分析联系起来。在与视觉感知的区别中,我们论述了嗅觉所面临的独特测量挑战,包括刺激的复杂性、 - 处理特殊缺失机制下的缺失数据综述
在数据科学中,缺失数据是一个重要的挑战,它对决策过程和结果产生影响。本文回顾了现有文献对处理缺失数据的方法进行了比较和对比,揭示了现有文献中的研究空白,并提出了未来研究的潜在方向。这个综述将帮助数据分析人员和研究人员在实际问题中采用和推广处 - 地理信息系统的数据科学
数据科学与地理信息系统的结合为完整的空间分析平台提供了发展的可能性,采用机器学习和大数据技术使得这些平台能够处理更大规模、越来越复杂的数据,超越了传统方法的局限性。本研究追踪了数据科学和地理信息系统作为研究领域的历史和技术演变,强调了领域之 - 释放大型语言模型在数据科学中预测表格任务的潜力
利用大型语言模型(LLMs)解决数据科学中与表格数据相关的预测任务的研究,通过创建一个包含注解指令的综合数据集来对 LLM 进行大规模训练,研究应用训练好的模型在零样本预测、少样本预测和上下文学习场景中的实际应用,并通过实验证明该方法在表格 - 用 DistClassiPy 进行光谱分类:一种新的基于距离的分类器
利用距离度量方法进行时间域天文分类的研究,开发了一种名为 DistClassiPy 的新的基于距离度量的分类器,该分类器在提高分类结果的可解释性和降低计算成本方面表现出色。
- 大学物理学中的数据科学教育:一个社群实践的经验教训
面对日益丰富的数据集和强大的数据分析工具的挑战,本研究以数据科学教育社群(DSECOP)为例,探讨了将数据科学整合到本科物理教育中的关键策略和挑战,并为教育工作者提供指导和启发。
- 可扩展多视图聚类通过显式核特征映射
在本文中,我们引入了一个新的多视图子空间聚类的可扩展性框架,并提出了一种有效的优化策略,利用核特征映射来减少计算负担,同时保持良好的聚类性能。该算法的可扩展性意味着它可以应用于包含数百万数据点的大规模数据集,并在几分钟内使用标准机器完成。我 - ACL学习高品质和通用性的短语表示
我们提出了一个改进的框架来以无上下文的方式学习短语表示,该框架使用短语类型分类作为辅助任务,并更有效地将字符级信息融入短语表示,通过设计三种不同程度的数据增强来增加训练样本的多样性,我们的实验结果表明,相对于先前的方法,我们的方法生成了更优 - 利用土耳其地震数据进行关联规则挖掘
通过数据科学方法,将土耳其地区最近 5 年地震活动作为关联规则挖掘任务的基础,发现了各种距离地区之间的统计推断和地质证据,为未来基于机器学习算法的关联规则挖掘工作提供了统计依据。
- AI 竞赛和基准测试:挑战和基准测试的生命周期
数据科学研究正在经历一场由技术、互联网和不断增长的计算能力驱动的革命。我们在此提出,需要创造性地利用科学研究和算法开发社区作为强大创新的轴心,通过关键评估、社区实验和集众智等方式,让这些社区参与科学发现探索,从而带来发展新的数据驱动、可复现 - 以数据为中心的数字农业:一个观点
数字农业通过数据科学、机器学习、传感技术、机器人技术和新的管理策略,在减少环境影响的同时满足全球对食物、饲料、纤维和燃料不断增长的需求。为了充分发挥数字农业的潜力,强调数据积极性的机器学习研究在此领域显得至关重要,需要发展获取和整理有价值数 - 英国医疗领域的人工智能研究中的多学科数据工作实践
多学科合作的人工智能(AI)工具在医疗保健领域的发展是一个跨学科的努力,需要数据科学家、临床医生、患者和其他学科共同参与。通过对大型研究合作中 13 个半结构化访谈的归纳主题分析,我们的发现表明多学科合作严重影响着工作实践。参与者面临学习其