一张图片胜过 500 个标签：Instagram 和 TikTok 本地机器学习模型中的人口统计差异案例研究

Mar, 2024

一张图片胜过 500 个标签：Instagram 和 TikTok 本地机器学习模型中的人口统计差异案例研究

A Picture is Worth 500 Labels: A Case Study of Demographic Disparities in Local Machine Learning Models for Instagram and TikTok

PDF

Jack West, Lea Thiemt, Shimaa Ahmed, Maggie Bartig, Kassem Fawaz...

TL;DR移动应用程序通过将数据处理移至用户的智能手机来保护用户隐私。利用先进的机器学习（ML）模型，如视觉模型，现在可以在本地分析用户图像以提取推动多种功能的见解。通过分析两个流行的社交媒体应用程序 TikTok 和 Instagram，揭示了（1）这两个应用中的视觉模型从用户的图像和视频数据中推测出的见解以及（2）这些模型在与人口统计学相关性方面是否存在性能差异。了解这些模型中的潜在偏见对于确保用户获得公平且准确的服务至关重要。我们开发了一种捕获和评估移动应用程序中 ML 任务的新方法，克服了代码混淆、本地代码执行和可扩展性等挑战。我们的方法包括 ML 任务检测、ML 流水线重建和 ML 性能评估，特别关注人口统计学的差异。我们将该方法应用于 TikTok 和 Instagram，揭示了重要的见解。对于 TikTok，我们发现了关于年龄和性别预测准确性的问题，特别是对未成年人和黑人个体而言。在 Instagram 中，我们的分析揭示了超过 500 个图像概念中的人口统计学差异，存在某些概念与人口统计学特征之间的虚假相关性。

Abstract

mobile apps have embraced user privacy by moving their data processing to the user's smartphone. Advanced machine learning (ML) models, such as vision models, can now locally analyze user images to extract insigh

mobile apps user privacy machine learning models vision models demographic disparities

发现论文，激发创造

未经筛选的图像 - 文本数据集：揭示人口特征偏见

我们研究了在视觉和语言模型训练中使用大型未筛选数据集的不公平表现，以及如何应对这个问题，研究发现社会偏见在图像生成、图像描述和图像文本嵌入等视觉语言任务中都是一个持续而普遍的问题。

Apr, 2023

现实世界深度学习应用中的模型选择差异影响

本文研究算法公平性中的偏见数据和人类偏好在模型选择中的作用，并通过真实医学影像数据的深度学习模型实证了模型比较指标的选择，特别是那些不考虑变异性，可能会对模型选择结果造成显着的偏差。

Apr, 2021

探究深度面部分析中的偏差：KANFace 数据集和实证研究

本文研究基于深度学习技术的面部识别、年龄估计、性别识别和亲属关系验证模型中存在的人口统计学偏差，并通过引入规模最大、最全面的面部图像和视频数据集及手动注释，揭示了基于最先进模型的拟合性能和偏差，最后引入和验证了去偏嵌入网络的方法。

May, 2020

建模人类行为的时间特性以预测人口统计信息

本研究利用深度学习直接对原始手机元数据建模，通过时间模式预测用户的基本人口统计信息，包括年龄和性别，并通过对模型假设的验证，获得了最先进的预测准确性。

Nov, 2015

使用 Transformer 进行基于 Twitter 的性别识别

本文提出基于 transformers 的模型，从社交媒体用户的图像和推文中预测其性别，从而解决性别信息不公开的问题，同时，图像分类和文本分类模型能够相互支持，提高整体分类准确率。

Apr, 2022

AI 系统公平性：缓解语言视觉模型中的性别偏见

本研究尝试减轻语言视觉模型中的性别偏见问题，通过研究现有数据集中性别偏见的影响程度，并提出一种缓解方法。

May, 2023

从多语种社交媒体数据中推断人口统计和代表性人口估计

本研究使用多语言人口统计学推断方法和后统计方法来纠正社交媒体数据的样本偏差，并减少算法偏差，在欧洲的跨语言环境下，并取得了显著的改进。

May, 2019

优化社交媒体帖子热度预测与视觉内容

利用图像信息和层次化数据结构，预测基于图像的社交媒体内容的流行度，通过 Google Cloud Vision API 提取关键图像和颜色信息，相比于单独使用非图像协变量，精度提升了 6.8%。通过线性混合模型、支持向量回归、多层感知机、随机森林和 XGBoost 等多种预测模型，对比实验表明能够捕捉协变量之间的非线性相互作用的模型优于其他方法。

May, 2024

构建一种可视化隐私建议系统：理解和预测图像中的隐私风险

该研究提出了一种基于可视化隐私顾问的方法，在图像内容方面扩展用户的隐私设置，以减轻用户分享图片带来的隐私风险和隐私泄露的风险。通过将个人信息映射为图像属性，从图像直接预测个人信息，了解不同用户在隐私属性方面的偏好，并在此基础上提出模型以预测用户在隐私风险方面的表现，并在一定程度上优于用户自己的隐私风险认知。

Mar, 2017

医学影像中专家级视觉语言基础模型的人口统计偏见

人工智能在医学影像应用中取得了专家级性能。然而，研究发现目前的视觉语言基础模型在胸部 X 射线诊断中普遍存在算法公平性问题，导致偏见对待历史上被边缘化的群体，并延迟特定人群的重要医疗护理，严重加剧现有的护理差异，对公平医疗保障带来挑战。

Feb, 2024