Aug, 2024

EditScribe: 基于自然语言验证循环的非视觉图像编辑

TL;DR本研究解决了盲人和低视力人士在图像编辑中面临的交互和反馈不足的问题。我们提出了一种名为EditScribe的原型系统,通过大型多模态模型,基于自然语言的验证循环,使图像编辑过程更具可访问性。研究发现,EditScribe能够支持用户以非视觉的方式执行和验证图像编辑操作,展示了自然语言验证循环在视觉创作中的潜在影响。