AesopAgent: 故事到视频制作的代理驱动演化系统
该论文介绍了一个名为 Sora 的大规模通用视频生成模型,随后提出了一个新的多智能体框架 Mora,通过多个视觉 AI 代理来复制 Sora 展示的通用视频生成能力,成功模拟了 Sora 在各种任务中的视频生成能力,并希望通过合作的 AI 代理引导未来的视频生成方向。
Mar, 2024
介绍了一种利用人工智能 (AI) 视频生成器在接收端的媒体服务模型,通过将部分内容创作转移到接收方,借助语义处理,将分布网络提供的服务元素作为语义源促使内容生成器,并将接收到的语义数据转换为视频帧,实现超个性化服务。该研究探索了一种由接收端嵌入生成模型支持的新型媒体生态系统,同时具有随机内容动态和提高传递效率的特点。
Feb, 2024
通过使用基于 Sora 的多模态学习,利用文本提示和相关图像来构建熟练的世界模型框架,该方法在维护时间一致性和确保动作流畅性方面表现出强大的效果和创新性。
Mar, 2024
提出了一种使用现有短视频合成视觉讲述视频的技术,该技术基于查询文本描述运动结构,在结构引导和外观指导下生成基于情节的视频,并通过概念个性化方法保证视频的视觉一致性。
Jul, 2023
本文介绍了一种将 Scheherazade 故事意图图转换成人物 NLG 引擎所需输入的自动方法,使用 36 个 Aesop 寓言进行测试,结果表明我们可以生成正确内容,平均与 Scheherazade 实现器的输出接近。
Aug, 2017
为了解决 6G 全球通信的需求,本文开发了用于模型建立的生成型人工智能代理,并应用混合专家方法设计传输策略。通过结合多个专业组件的专业知识,并利用生成代理所提供的问题求解,验证了该方法在解决问题上的准确性和有效性。
Apr, 2024
在 6G 时代,智能交通系统、数字孪生、远程监控有望成为普遍实践。为了解决无线网络中庞大数据量和频繁更新的挑战,本文提出了一种基于强化学习的新型代理驱动生成语义通信(A-GSC)框架。通过无缝地结合源信息的内在属性和任务相关的情境信息,本研究在语义通信领域进行了创新,同时引入了生成人工智能(GAI),实现了语义编码器和解码器的独立设计。在实证分析中,基于 CDNet2014 数据集验证了所设计模型的有效性,并证明了整体 A-GSC 框架在节能和重构准确性方面的性能提升。
Apr, 2024
文本到视频生成技术的进展与 Sora 模型的发展路径和应用,以及技术挑战与未来改进方向进行全面探讨,旨在促进文本到视频生成领域的创新与讨论。
Mar, 2024
利用 Lyfe Agents 实现了高度自治生成智能代理,能够在虚拟社会中模拟复杂的社交行为,并能以低计算成本与人进行实时互动,通过自主协作和信息交流解决犯罪等问题,同时比现有替代方案的计算成本低 10-100 倍。
Oct, 2023