Jan, 2024

基于人工智能的手机应用程序评论中公平性关注的研究

TL;DR在本篇研究中,我们通过构建一个包含公平性和非公平性评论的统计样本数据集,开发和评估了一组机器学习和深度学习分类器,用于区分公平性评论和非公平性评论。我们的实验结果表明,我们最佳的分类器能以 94% 的准确率检测出公平性评论。然后,我们将最佳分类器应用于收集自 108 个 AI 应用的大约 950 万条评论,并识别出约 92,000 个公平性评论。公平性评论分布在 23 个应用类别中,其中 ' 通讯 ' 和' 社交 ' 应用类别的公平性评论所占比例最高。通过对这 92,000 个公平性评论应用 K-means 聚类技术和手动分析,我们识别出了六种不同类型的公平性问题。最后,对于这些公平性评论,我们手动分析了 2,248 个应用开发者的回复,找出了六个根本原因以及应用开发者为公平性问题提出的几种合理解释。