多数据模态的人工智能通用计算:综述
该研究综述了生成模型的历史和基本组成部分,并从单模态和多模态交互的角度介绍了文本和图像生成任务及相关模型,讨论了人工智能生成内容领域中的开放性问题和未来挑战。
Mar, 2023
人工智能在生成内容领域取得了显著进展,其中 3D 内容生成作为视觉模态之一,面临巨大的知识和技术挑战。本研究回顾了 3D 内容生成技术的发展,并提出了一个新的分类法,详细介绍了三种不同类型的方法。同时,讨论了当前技术的局限性以及未来工作的挑战和方向。
Feb, 2024
本文深入讨论了基于人工智能技术生成内容的 AIGC,对其定义、关键条件、可重要的现有和未来特性、庞大的预训练模型带来的优势、工业链以及 AIGC 内部辅助生成和自动生成之间的区别进行了探讨,最后探讨了 AIGC 与元宇宙的潜在整合,旨在揭示 AIGC 的现有问题并提供未来应用方向。
Mar, 2023
这项研究基于 Text-to-Video 人工智能生成内容 (AIGC) 的最新进展,针对 AIGC 视频的质量评估遇到的挑战进行了分类,并提出了特定模块来综合评估 AIGC 视频的视觉和内容一致性,在不同的生成模型中发现了重要的视觉质量、流畅度和风格差异。通过预测源生成模型,可以提高 AIGC 视频特性的差异性,从而提高质量评估性能。该方法在 NTIRE 2024 质量评估比赛中获得了第三名,展示了其有效性。
Apr, 2024
人工智能生成内容(AIGC)已经引领了一场新的技术革命,推动了数字内容的获取并推动传统编解码器在性能提升和多样化功能方面的进展,本文全面回顾了生成式视觉压缩的最新进展,展示了在超低码率通信,用户指定的重建 / 滤波和智能机器分析方面的巨大潜力和有前景的应用。特别是,我们回顾了基于深度生成模型的视觉数据压缩方法,并总结了如何通过生成技术实现紧凑的表示和高保真重建。此外,我们概括了相关的生成式压缩技术用于机器视觉和智能分析。最后,我们讨论了生成式视觉压缩技术面临的基本挑战,并展望了它们未来的研究方向。
Feb, 2024
最近几年,大型语言模型和扩散模型等生成人工智能模型在内容生产方面产生了革命性的影响,其生成的内容已嵌入到日常生活和工作的各个方面,涵盖了文本、图像、视频和音频。尽管人工智能生成的内容的真实性越来越高,接近人类创作水平,但这些技术也导致了伪造的人工智能生成内容的出现,给真伪信息的鉴别带来了新的挑战。本文提出了一个新的分类方法,更全面地介绍了目前伪造的人工智能生成内容的方法。接下来,我们探讨了伪造的人工智能生成内容的模态和生成技术,归类为人工智能生成的虚假信息和误导信息。在多个角度上,我们介绍了伪造的人工智能生成内容的检测方法,包括欺骗性伪造的检测、深度伪像的检测和错觉性伪造的检测。最后,我们讨论了未来研究的重要挑战和有希望的研究领域。
Apr, 2024
本文旨在探讨 AI 生成内容(AIGC)的三个主要问题:隐私、偏见、毒性、误导和知识产权的风险,并提供解决这些风险的可行方向,以实现 AIGC 的负责任和安全部署。
Mar, 2023
本研究主要介绍了生成人工智能中的文本导向内容生成,着重探讨其中的文本导向三维技术,提供了一份关于该领域的综合调查报告。该报告介绍了三维数据表示、相关技术及其在不同应用方面的应用,包括头像生成、纹理生成、形状变换和场景生成,以及使用 NeRF 等文本到图像与三维建模技术的新兴方向的最新进展。
May, 2023
通过引入内容生成层,将人工智能生成内容 (AIGC) 与语义通讯 (SemCom) 结合起来,提供了清晰的 AIGC 与 SemCom 之间互动产生有意义和有效内容的概念模型,并提出了一种基于 AIGC 技术的语义信息编码器和解码器的新框架,以优化 AIGC 服务的语义提取和评估指标,从而适应不同类型的内容生成、所需质量和语义信息使用。通过使用深度 Q 网络 (DQN),展示了对优化问题的可行性和收敛特性的有益见解。
Aug, 2023
人工智能生成内容(AIGC)时代的大脑条件多模态综合继续发展,通过建立不同模态之间的映射关系,将脑信号反解码为知觉体验,这对于开发实用的脑 - 计算机界面系统和揭示大脑感知和理解外界刺激的复杂机制具有重要意义。本综述全面研究了基于 AIGC 的脑条件多模态综合,即 AIGC-Brain,勾勒了当前研究现状和未来方向。
Dec, 2023