自动数据科学中的语义调研
本文讨论了当前数据科学和机器学习自动化解决方案的重要缺陷,并设想如何利用语义理解和推理与数据科学自动化的新工具相结合,以帮助保持一致且可解释的数据增强和转换。另外,我们还讨论了语义如何在处理与信任、偏见和可解释性相关的挑战方面以一种崭新的方式帮助数据科学家,并在更好地探索和组织大型数据源方面提供帮助。
Mar, 2023
本研究从广阔的角度观察模型可解释性,超越了机器学习的范畴,涵盖了分布语义学和模糊逻辑等不同的人工智能领域。我们根据模型的性质和它们引入可解释性方面的方法进行分类,并分析每种方法如何影响最终用户。同时指出还需要解决的问题,以提供更以人为本的解释性解决方案。
Jul, 2019
数据科学的主要目标是从数据中获取有意义的信息,本文尝试自动化数据分析的关键性环节,并通过实现数据分析方法和建立领域特定知识的链接,以及验证功能,为全自动数据分析铺平道路。
Oct, 2023
本文提出了一种通过应用机器学习改善数据空间语义互操作性的方案,自动生成和更新元数据、更灵活的词汇,使不同子群体使用不同的术语成为可能,以解决当前数据交换的限制。
Mar, 2023
该研究讨论了 AutoAI 或 AutoML 对数据科学实践的影响,并发现未来的数据科学工作将是人类和 AI 系统之间协作的结果,其中自动化和人类专业知识是不可或缺的。
Sep, 2019
近年来,大型预训练语言模型(如 BERT 和 GPT)显著改进了各种任务的信息提取系统,包括关系分类。然而,解释性的不足目前是许多实际应用中的一个复杂因素。本文提出了语义范围的概念,用于分析关系分类任务的决策模式,并通过比较人类和模型的语义范围,揭示出模型倾向于从数据中学习快捷模式的问题。我们的方法可以帮助检测和消除模型开发过程中的虚假决策模式,进一步提高自然语言处理系统的可靠性和安全性,并为解释深度学习模型开辟了新的研究方向。
Aug, 2023
数据湖系统中的语义数据管理及可扩展性对大数据具有挑战,本研究回顾了最近的方法,重点关注数据湖系统内的应用,涉及基本语义数据管理、丰富数据湖中元数据的语义建模方法和基于本体的数据访问方法,同时指出未来工作中需要更紧密地集成大数据和语义 Web 技术。
Oct, 2023
现代人工智能(AI)的方法旨在设计可以直接从数据中学习的算法,本文综述了深度学习流程中自动化数据处理任务的方法,包括数据预处理、数据增强和特征工程,并讨论了自动机器学习方法和工具在整个机器学习流程中的优化应用。
Mar, 2024
本综述分析了语义处理的五个任务:词义消歧、指代消解、命名实体识别、概念提取和主观性检测,并研究了相关的理论研究、先进方法和下游应用。同时,我们还对不同的语义处理技术进行了比较,并总结了它们的技术趋势、应用趋势和未来方向。
Oct, 2023