Oct, 2023
大规模文本图像模型中检测隐含刻板印象的语言代理
Language Agents for Detecting Implicit Stereotypes in Text-to-image Models at Scale
Qichao Wang, Tian Bian, Yian Yin, Tingyang Xu, Hong Cheng...
TL;DR这篇研究论文介绍了一种面向文本到图像模型的刻板印象检测的新型代理架构,并发现在个人特征、社会文化背景和犯罪相关方面存在严重的刻板印象。该论文还强调了在人工智能生成内容领域中解决潜在伦理风险的紧迫性。