生成 AI 可能更愿意基于大陆级别的刻板地理印象呈现城市的国家级特征
本研究探讨了生成人工智能在理解城市人类感知方面的能力,在通过筛选的文字和图像描述来捕捉城市地方认同感方面具有潜力,因此它可以为城市设计文献提供未来研究机会和潜在局限性。
Jun, 2023
这项研究分析了由三种流行的生成人工智能工具生成的图像 - Midjourney、Stable Diffusion 和 DALLE 2 - 代表各种职业,以调查 AI 生成器中潜在的偏见。我们的分析揭示了这些 AI 生成器中两个主要关注领域,包括(1)系统性的性别和种族偏见,以及(2)面部表情和外貌方面的微妙偏见。
Mar, 2024
通过一项初步研究,我们探索了城市游戏互动中 AI 图像技术的体验和设计空间,强调了 AI 图像技术支持玩味、重塑和重新发现城市景观的能力,并提出了 AI 图像技术作为 “旅游者” 的隐喻来讨论其参与探索和对地方刻板印象的风险,为未来创造带有生成型人工智能的城市游戏的 HCI 努力提供了初步的经验见解和设计考虑。
Jun, 2024
本文中,我们采用众包研究来衡量使用 DALL.E 2 和 Stable Diffusion 模型对普通名词进行生成时,生成图像对全球各地表现力的代表性。我们发现,对于没有特定国名的输入,生成的图像表现美国和印度的环境最好,其他国家的表现不如其它的。如果在输入中指定国家名称,则 DALL.E 2 的表现提升了 1.44 分,Stable Diffusion 的表现提升了 0.75 分,但许多国家的总体得分仍然很低,需要未来的模型在地理上更加包容。最后,我们研究了在不进行用户研究的情况下量化生成图像在地理上的代表性的可行性。
May, 2023
本文主要阐述了城市视觉信息在城市研究中的重要性以及新的图像数据和 AI 技术如何改变了城市研究的方式并引入了 Urban Visual Intelligence 的概念框架,使得城市的物理环境和社会经济环境在各种尺度上相互作用并研究可能有助于城市在数字时代创造更符合人类行为和愿望的环境。
Jan, 2023
通过使用现有的文字资源来评估 T2I 模型生成的图像中的地缘文化刻板印象,我们的研究表明在与其他属性相比,特定身份群体的图像中刻板印象出现的可能性是其他属性的三倍,并揭示出所有身份群体的默认代表都具有刻板印象的外观。
Jan, 2024
通过进行大规模的跨文化研究,我们发现不同地理位置的人对地理表达、视觉吸引力和一致性的偏好存在显著差异,并且目前常用的自动评估指标不能充分考虑这种多样性。我们建议改进自动和人工评估方法。
May, 2024
这篇论文提出了一种集成计算机视觉和生成式人工智能(genAI)的新方法,通过先进的图像分割和扩散模型的协同作用,实现了城市设计的全面方法。我们的研究方法涵盖了详细图像分割的 OneFormer 模型和通过 ControlNet 实现的文本描述生成图像的稳定扩散 XL(SDXL)扩散模型。早期测试表明,UrbanGenAI 不仅提升了城市景观重建的技术前沿,也在设计教学和社区参与的城市规划方面提供了显著的益处。UrbanGenAI 的持续发展旨在对其在更广泛的背景下的有效性进行进一步验证,并集成实时反馈机制和三维建模能力等附加功能。
Jan, 2024
本文是一篇文献综述,探讨了 AI 生成模型在静态和交互媒体中简化视觉创造流程的巨大潜力及其在技术和伦理方面对多个重要产业的影响,涵盖了 AI 文本到图像生成、Midjourney、Stable Diffusion、AI 伦理、游戏设计、数字艺术和数据洗白等方面的关注点和挑战,以及如何通过适当的监管解决相关的法律、伦理等问题。
May, 2023