数据视觉:算法抽象中的学习视觉
本文采用结构化和主题内容分析研究了计算机视觉数据集的文档记录,强调了计算机视觉数据集作者重视效率、普遍性、客观性和模型工作的做法,而这些做法与社交计算实践相矛盾。研究人员提出了在数据集创建和管理过程中更好地融入这些价值观的建议。
Aug, 2021
数据科学的主要目标是从数据中获取有意义的信息,本文尝试自动化数据分析的关键性环节,并通过实现数据分析方法和建立领域特定知识的链接,以及验证功能,为全自动数据分析铺平道路。
Oct, 2023
本论文对机器学习模型的数据方面的可视化相关研究进行了系统梳理和分析,提出了五类数据类型和六种数据中心任务,并分析了 143 篇论文的相关分布,展望了未来的研究趋势和方向。
Jul, 2023
数据分析和算法决策越来越影响我们生活的各个方面,因此有必要确保它们不成为歧视,不公平,社会正义和不公平源泉的工具。本文提出了一个明确的研究议程,旨在解决这些问题。重点包括:确定模型是否存在偏见,将公平意识纳入机器学习方法中,提高数据驱动和模型驱动决策的透明度和控制以及支持跨学科研究来解决这些问题
Jun, 2017
采用一种基于强化学习实现的框架,实现了自动对序列数据进行目标驱动的数据抽象。该框架在不受数据输入顺序限制的同时,还可以定义不同的目标,以便以最好的方式保留输入数据的不同方面,能够在涉及手稿、视频和文本数据的情况下实现最佳抽象结果。
Jul, 2019
本文讨论了当前数据科学和机器学习自动化解决方案的重要缺陷,并设想如何利用语义理解和推理与数据科学自动化的新工具相结合,以帮助保持一致且可解释的数据增强和转换。另外,我们还讨论了语义如何在处理与信任、偏见和可解释性相关的挑战方面以一种崭新的方式帮助数据科学家,并在更好地探索和组织大型数据源方面提供帮助。
Mar, 2023
机器视觉算法对图像的处理和决策至关重要,但是数据集中的错误可能会导致认为黑人是大猩猩或搜索结果中误代表某些族裔,本文追踪数据集中的错误及其影响,揭示了一个缺陷的数据集可能是类别有限、数据来源不全和分类不当的结果。
Nov, 2022