自动数据科学中的语义调研

May, 2022

A Survey on Semantics in Automated Data Science

Udayan Khurana, Kavitha Srinivas, Horst Samulowitz

TL;DR本文介绍了当前自动化数据科学和机器学习的重要缺陷，并讨论了如何利用基本的语义推理和新型数据科学自动化工具相结合来帮助数据扩充和转换的一致性和可解释性。此外，语义可以通过帮助解决信任、偏见和可解释性方面的挑战，以一种新的方式协助数据科学家。

Abstract

Data Scientists leverage common sense reasoning and domain knowledge to understand and enrich data for building predictive models. In recent years, we have witnessed a surge in tools and techniques for {\em automated machine learning}. While data scientists can employ various such tools to help with model building, many other aspects such as {\em

automated machine learning feature engineering semantic reasoning data augmentation explainability

发现论文，激发创造

语义化数据科学的愿景

本文讨论了当前数据科学和机器学习自动化解决方案的重要缺陷，并设想如何利用语义理解和推理与数据科学自动化的新工具相结合，以帮助保持一致且可解释的数据增强和转换。另外，我们还讨论了语义如何在处理与信任、偏见和可解释性相关的挑战方面以一种崭新的方式帮助数据科学家，并在更好地探索和组织大型数据源方面提供帮助。

Mar, 2023

人工智能模型语义可解释性

本研究从广阔的角度观察模型可解释性，超越了机器学习的范畴，涵盖了分布语义学和模糊逻辑等不同的人工智能领域。我们根据模型的性质和它们引入可解释性方面的方法进行分类，并分析每种方法如何影响最终用户。同时指出还需要解决的问题，以提供更以人为本的解释性解决方案。

Jul, 2019

自动化数据分析的轻量级知识表示

数据科学的主要目标是从数据中获取有意义的信息，本文尝试自动化数据分析的关键性环节，并通过实现数据分析方法和建立领域特定知识的链接，以及验证功能，为全自动数据分析铺平道路。

Oct, 2023

利用机器学习增强数据空间语义互操作性：一种展望性视角

本文提出了一种通过应用机器学习改善数据空间语义互操作性的方案，自动生成和更新元数据、更灵活的词汇，使不同子群体使用不同的术语成为可能，以解决当前数据交换的限制。

Mar, 2023

数据科学中的人工智能协作：探究数据科学家对自动化人工智能的认知

该研究讨论了 AutoAI 或 AutoML 对数据科学实践的影响，并发现未来的数据科学工作将是人类和 AI 系统之间协作的结果，其中自动化和人类专业知识是不可或缺的。

Sep, 2019

用语义区间解释关系分类模型

近年来，大型预训练语言模型（如 BERT 和 GPT）显著改进了各种任务的信息提取系统，包括关系分类。然而，解释性的不足目前是许多实际应用中的一个复杂因素。本文提出了语义范围的概念，用于分析关系分类任务的决策模式，并通过比较人类和模型的语义范围，揭示出模型倾向于从数据中学习快捷模式的问题。我们的方法可以帮助检测和消除模型开发过程中的虚假决策模式，进一步提高自然语言处理系统的可靠性和安全性，并为解释深度学习模型开辟了新的研究方向。

Aug, 2023

数据湖中的语义数据管理

数据湖系统中的语义数据管理及可扩展性对大数据具有挑战，本研究回顾了最近的方法，重点关注数据湖系统内的应用，涉及基本语义数据管理、丰富数据湖中元数据的语义建模方法和基于本体的数据访问方法，同时指出未来工作中需要更紧密地集成大数据和语义 Web 技术。

Oct, 2023

依赖项：为信息检索形式化语义链

本论文在语义处理方面做出重大贡献，提出了多种数学模型以及解决研究范式中存在问题的建议，从而大大提升了机器自动进行语义推理的复杂性和粒度。

Sep, 2017

深度学习和大数据应用的自动数据处理和特征工程：一项调研

现代人工智能（AI）的方法旨在设计可以直接从数据中学习的算法，本文综述了深度学习流程中自动化数据处理任务的方法，包括数据预处理、数据增强和特征工程，并讨论了自动机器学习方法和工具在整个机器学习流程中的优化应用。

Mar, 2024

语义处理技术综述

本综述分析了语义处理的五个任务：词义消歧、指代消解、命名实体识别、概念提取和主观性检测，并研究了相关的理论研究、先进方法和下游应用。同时，我们还对不同的语义处理技术进行了比较，并总结了它们的技术趋势、应用趋势和未来方向。

Oct, 2023