May, 2024

LLMs 满足多模态生成和编辑的综述

TL;DR多模态生成技术的调查,介绍了不同领域中的重要进展,包括图像、视频、3D 和音频,研究了方法和数据集,还提出了使用现有生成模型进行人机交互的工具增强型多模态代理,同时探讨了人工智能安全问题和新兴应用及未来前景。