数据视觉：算法抽象中的学习视觉

Feb, 2020

数据视觉：算法抽象中的学习视觉

Data Vision: Learning to See Through Algorithmic Abstraction

Samir Passi, Steven J. Jackson

TL;DR本文研究了数据学习环境中机械化应用规则与情境性抉择之间的关系，阐述了数据视力的重要性并讨论了其对数据分析学习、研究和实践的作用。

Abstract

Learning to see through data is central to contemporary forms of algorithmic knowledge production. While often represented as a mechanical application of rules, making algorithms work with data requires a great deal of situated work. This paper examines how the often-divergent demands of mechanization and discretion manifest in →

data vision algorithmic knowledge production data analytic learning environments formal abstraction empirical contingency

发现论文，激发创造

计算机视觉中可用机器学习的民主化

本文对于使用计算机视觉的重要领域，利用 SWOT 分析法提出了针对大众可用 ML 工具的教育和支持培养数据科学素养标准的建议。

Feb, 2019

数据集是否存在政治性？计算机视觉数据集开发中的学科价值观

本文采用结构化和主题内容分析研究了计算机视觉数据集的文档记录，强调了计算机视觉数据集作者重视效率、普遍性、客观性和模型工作的做法，而这些做法与社交计算实践相矛盾。研究人员提出了在数据集创建和管理过程中更好地融入这些价值观的建议。

Aug, 2021

自动化数据分析的轻量级知识表示

数据科学的主要目标是从数据中获取有意义的信息，本文尝试自动化数据分析的关键性环节，并通过实现数据分析方法和建立领域特定知识的链接，以及验证功能，为全自动数据分析铺平道路。

Oct, 2023

机器学习的视觉分析：数据视角调查

本论文对机器学习模型的数据方面的可视化相关研究进行了系统梳理和分析，提出了五类数据类型和六种数据中心任务，并分析了 143 篇论文的相关分布，展望了未来的研究趋势和方向。

Jul, 2023

可解释深度学习的可视化分析

本文回顾了与深度学习可解释性和控制相关的视觉分析、信息可视化和机器学习观点，讨论了潜在的挑战和未来研究方向。

Apr, 2018

大数据、数据科学与公民权利

数据分析和算法决策越来越影响我们生活的各个方面，因此有必要确保它们不成为歧视，不公平，社会正义和不公平源泉的工具。本文提出了一个明确的研究议程，旨在解决这些问题。重点包括：确定模型是否存在偏见，将公平意识纳入机器学习方法中，提高数据驱动和模型驱动决策的透明度和控制以及支持跨学科研究来解决这些问题

Jun, 2017

目标驱动的序列数据抽象

采用一种基于强化学习实现的框架，实现了自动对序列数据进行目标驱动的数据抽象。该框架在不受数据输入顺序限制的同时，还可以定义不同的目标，以便以最好的方式保留输入数据的不同方面，能够在涉及手稿、视频和文本数据的情况下实现最佳抽象结果。

Jul, 2019

语义化数据科学的愿景

本文讨论了当前数据科学和机器学习自动化解决方案的重要缺陷，并设想如何利用语义理解和推理与数据科学自动化的新工具相结合，以帮助保持一致且可解释的数据增强和转换。另外，我们还讨论了语义如何在处理与信任、偏见和可解释性相关的挑战方面以一种崭新的方式帮助数据科学家，并在更好地探索和组织大型数据源方面提供帮助。

Mar, 2023

可视化过程可以优化什么？

本文提出了可视化和推理过程的抽象模型，并描述了一种信息论度量来优化这些过程。我们提出了一种基于信息论的成本效益比度量，以优化数据可视化过程。

Jun, 2015

看见不可见之物：视觉数据集中的错误和偏差

机器视觉算法对图像的处理和决策至关重要，但是数据集中的错误可能会导致认为黑人是大猩猩或搜索结果中误代表某些族裔，本文追踪数据集中的错误及其影响，揭示了一个缺陷的数据集可能是类别有限、数据来源不全和分类不当的结果。

Nov, 2022