- 增强式补丁编码提示图像生成
我们提出了一种基于修补增强遮罩编码器的方法,以确保准确的产品描述,并同时保留多样的背景图像。我们的方法包括三个组成部分:补丁灵活可见性、遮罩编码器提示适配器和图像基础模型。实验结果显示,与其他方法相比,我们的方法在视觉结果和 FID 评分方 - 理解和评估人类对 AI 生成图像的偏好与指导调试
人工智能生成内容(AIGC)在近年来迅速增长,其中基于人工智能图像生成的技术因其高效且富有想象力的图像创作能力而受到广泛关注。然而,由于其独特的失真问题,人工智能生成的图片(AIGIs)可能无法满足人们的喜好,因此有必要了解和评估人们对 A - 三元探测器:基于文本辅助和注意力机制的光谱融合用于扩散生成图像检测
本文提出了一种针对扩散模型特别设计的伪造检测方法 —— 三位一体检测器,它通过使用 CLIP 编码器将粗粒度文本特征与像素域中的细粒度伪造物相结合,实现了综合多模态检测。通过设计多光谱通道注意力融合单元(MCAF),提取频谱不一致性,并进一 - CVPRPCQA:基于提示条件的 AIGC 质量评估的强基准
研究提出了一种基于混合提示编码和基于集成的特征混合模块的 AIGC 质量评估框架,验证了方法在两个数据集上的有效性,从而促进了多模态生成领域的研究发展。
- ShoeModel: 通过扩散模型学习穿戴用户指定鞋子
本文提出了一种名为 Shoe-Model 的穿鞋系统,利用人工智能生成内容技术在电子商务营销领域生成超逼真的广告图像,为用户指定的鞋子生成与人体互动的逼真图像。通过三个模块:鞋子可穿戴区域检测模块(WD)、腿部姿势合成模块(LpS)和最终的 - AIGCOIQA2024: AI 生成全方位图像的感知质量评估
建立了一个名为 AIGCOIQA2024 的大规模 AI 生成全景图像 IQA 数据库,并构建了一个综合基准,以评估最先进的 IQA 模型在该数据库上的性能。
- 打击谣言的未来?检索、筛选和生成
人工智能生成的内容 (AIGC) 技术发展促进了谣言传播,影响了社会、经济和政治生态系统,挑战了民主。我们提出了一种全面的辟谣过程,不仅可以检测谣言,还可以提供解释性生成内容来驳斥信息的真实性。我们设计的 “专家 - 公民集体智慧”(ECC - 音频驱动的真人假头视频的感知质量评估比较研究
通过进行控制性的心理物理实验,我们验证了模型预测与人工注释之间的一致性,鉴定出相对于广泛使用的度量方法更能与人类意见相符的评估指标,以填补评估研究在视觉质量、嘴唇音频同步和头部移动自然性方面的空白。我们相信我们的工作将促进性能评估和模型开发 - 基于检索辅助的人工智能生成内容:综述
人工智能生成内容(AIGC)发展已经通过模型算法的进展、可扩展的基础模型结构和大量高质量数据集的可用性得到促进。检索增强生成(Retrieval-Augmented Generation,RAG)作为一种范例,通过从可用数据存储中检索相关对 - AIGCBench:AI 生成的图像到视频内容的综合评估
人工智能生成内容(AIGC)领域迅速发展,本研究介绍了 AIGCBench,一个全面且可扩展的基准测试,旨在评估各种视频生成任务,主要集中在图像到视频(I2V)生成上。
- 脑条件多模态综合:综述和分类
人工智能生成内容(AIGC)时代的大脑条件多模态综合继续发展,通过建立不同模态之间的映射关系,将脑信号反解码为知觉体验,这对于开发实用的脑 - 计算机界面系统和揭示大脑感知和理解外界刺激的复杂机制具有重要意义。本综述全面研究了基于 AIGC - PSCR: 基于补丁采样的对比回归在 AIGC 图像质量评估中的应用
人为智能生成内容图像质量评估中引入基于对比回归的框架以及基于补丁采样的策略可以显著提高模型性能。
- 关于水印人工智能生成内容的弱点研究
人工智能生成内容 (AIGC) 在社交媒体上越来越受欢迎,其服务利用先进的生成模型,如潜在扩散模型和大型语言模型,为用户生成创意内容 (例如逼真的图像,流畅的句子)。本文展示了水印在生成的内容中的易破解性,并提出了 WMaGi 框架,通过利 - SketchDreamer:互动的文本增强创意草图构思
通过与文本交互的过程,本文提出了一种名为 SketchDreamer 的方法,利用基于像素表示的图像的文本条件扩散模型训练来生成受控素描,并使文本和素描能够相互作用,以实现非专业用户创作素描,并将叙述扩展为故事板。
- 人工智能通用智能的新解决方案和具体实施步骤
通过解决大规模模型的局限性以及利用现有技术,本文提出解决方案,进而解决大规模模型固有的缺陷,逐步实现真正的人工智能通用智能。
- 人工智能生成内容(AIGC)的语义通信:朝着有效内容创作迈进
通过引入内容生成层,将人工智能生成内容 (AIGC) 与语义通讯 (SemCom) 结合起来,提供了清晰的 AIGC 与 SemCom 之间互动产生有意义和有效内容的概念模型,并提出了一种基于 AIGC 技术的语义信息编码器和解码器的新框架 - 图像标题是文本到图像模型的自然提示
论文理论分析了合成数据的训练效果和提示诱导的合成数据分布之间的关系,并相应地提出了一种简单而有效的方法,通过图像字幕和类名来提示生成模型,从而合成更具信息性和多样性的训练数据。实验证明,该方法显着提高了在合成训练数据上训练的模型的表现。
- 无线网络中基于联邦学习的 AI 生成内容
本文介绍了基于联邦学习技术实现艺术智能生成内容的方法,解决了中心化训练带来的隐私问题,并成功应用于 AIGC 的微调中, 可以有效减少通信成本和训练延迟。
- AIGC 隐私与安全挑战及其补救:探索隐私计算、区块链等技术的潜力
本文系统地回顾了 AIGC 的概念、分类和基础技术,讨论了从多个角度面临的隐私和安全挑战,并针对性地列出了当前存在的应对措施。作者希望这项调查能帮助研究人员和企业构建更安全、更健壮的 AIGC 系统。
- 人工智能生成内容的综合调查(AIGC):从 GAN 到 ChatGPT 的生成式人工智能历史
该研究综述了生成模型的历史和基本组成部分,并从单模态和多模态交互的角度介绍了文本和图像生成任务及相关模型,讨论了人工智能生成内容领域中的开放性问题和未来挑战。