- DALL-E 2 的伦理状况
研究了人工智能图像生成系统的伦理问题,着重分析了社会对此的回应以及应对措施。
- DALL-E 2 中组合句法和语义的比较研究
DALL-E 2 在语义准确性方面无法与年幼儿童相媲美,这表明它在组合句子表示方面存在明显缺陷。
- 文本图像模型的安全过滤器绕过方法
我们成功地设计并展示了对 Midjourney 的首个 prompt 攻击,从而生成大量逼真的不适宜工作场所的图像,揭示了此类攻击的基本原理,并建议通过策略性地替换可疑提示中的高风险部分来规避闭源安全措施。我们的新框架 SurrogateP - 不用我的名字!推测由扩散模型使用的输入字符串的艺术家姓名
该论文旨在研究通过艺术家的姓名作为输入生成类似其作品的图像,并使用一种专用的孪生神经网络推断生成图像中是否含有艺术家姓名的概率。实验结果表明,这种方法是一个理想的起点,并且可以作为预测调查图像的完整输入字符串的先验信息。
- 笑脸女性下降:审计图像生成 AI 中的代表性和呈现性性别偏见
本研究分析了 15,300 个 DALL-E 2 图像,发现其在男性主导领域中低估女性,而在女性主导领域中高估女性,同时揭示了这些图像中的性别偏见,需要采取女性主义干预手段以防止这些带有偏见的 AI 生成图片反馈到媒体生态环境中。
- CVPR文本到图像合成的 GAN 扩展
本文提出了一种新的 GAN 架构 GigaGAN,用于文本到图像合成,并比较了其与传统的 GANs 和 DALL-E2 的性能,结果表明 GigaGAN 可以快速且高质量地合成高分辨率图像。
- 从扩散模型获取训练数据
本文研究了图像扩散模型,如 DALL-E 2,Imagen 和 Stable Diffusion,发现它们从训练数据中记忆单个图像并在生成时发射此类图像,总结了此类模型的隐私风险和影响隐私保护培训的新进展。
- DALL-E 2 无法可靠地捕捉常见的语法过程
评估了 DALL-E 2 捕捉语言学家广泛讨论的 8 种语法现象的能力,结果表明 DALL-E 2 不能可靠地推断与语法一致的含义,这挑战了最近有关这类系统理解人类语言能力的论点。
- DALL-E 2 对放射学的了解是什么?
DALL-E 2 是一种有前途的生成模型,可用于 AI 建模领域中的图像生成、增强和操作,但需要进一步调整和适应。作者表明 DALL-E 2 已经学习到了 X 射线图像的相关表示,并展示了用于图像生成的零射击文本,延续原始边界图像,或去除元 - DALL-E 2 的初步分析
DALL-E 2 生成与输入文本相对应的原创合成图像,并进行了 14 项测试,以评估其常识,推理和理解复杂文本的能力。