AesopAgent: 故事到视频制作的代理驱动演化系统

Mar, 2024

AesopAgent: 故事到视频制作的代理驱动演化系统

AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production

Jiuniu Wang, Zehua Du, Yuyuan Zhao, Bo Yuan, Kexiang Wang...

TL;DRAesopAgent 是一个代理驱动的进化系统，用于多模态内容生成，在视觉叙事方面取得了最先进的性能。

Abstract

The Agent and AIGC (Artificial Intelligence Generated Content) technologies have recently made significant progress. We propose AesopAgent, an Agent-driven Evolutionary System on Story-to-video production. AesopAgent is a practical application of agent technology for →

agent-driven evolutionary system multimodal content generation video production rag-based evolutionary system visual storytelling

发现论文，激发创造

Mora: 通过多代理框架实现通用视频生成

该论文介绍了一个名为 Sora 的大规模通用视频生成模型，随后提出了一个新的多智能体框架 Mora，通过多个视觉 AI 代理来复制 Sora 展示的通用视频生成能力，成功模拟了 Sora 在各种任务中的视频生成能力，并希望通过合作的 AI 代理引导未来的视频生成方向。

Mar, 2024

基于生成 AI 的动态超个性化媒体生态系统：永不重复的不可预测剧本

介绍了一种利用人工智能 (AI) 视频生成器在接收端的媒体服务模型，通过将部分内容创作转移到接收方，借助语义处理，将分布网络提供的服务元素作为语义源促使内容生成器，并将接收到的语义数据转换为视频帧，实现超个性化服务。该研究探索了一种由接收端嵌入生成模型支持的新型媒体生态系统，同时具有随机内容动态和提高传递效率的特点。

Feb, 2024

WorldGPT: 一个受 Sora 启发的视频 AI 代理，将文本和图像输入作为丰富的世界模型

通过使用基于 Sora 的多模态学习，利用文本提示和相关图像来构建熟练的世界模型框架，该方法在维护时间一致性和确保动作流畅性方面表现出强大的效果和创新性。

Mar, 2024

利用检索辅助视频生成技术的动画故事讲述

提出了一种使用现有短视频合成视觉讲述视频的技术，该技术基于查询文本描述运动结构，在结构引导和外观指导下生成基于情节的视频，并通过概念个性化方法保证视频的视觉一致性。

Jul, 2023

EvoAgent：通过进化算法实现自动多智能体生成

通过应用进化算法，EvoAgent 可以自动将专家代理扩展为多代理系统，从而提高基于大型语言模型的代理在解决任务中的效力。

Jun, 2024

从叙事的语义表示中生成不同的故事

本文介绍了一种将 Scheherazade 故事意图图转换成人物 NLG 引擎所需输入的自动方法，使用 36 个 Aesop 寓言进行测试，结果表明我们可以生成正确内容，平均与 Scheherazade 实现器的输出接近。

Aug, 2017

卫星网络中的交互式生成型人工智能代理通过专家组合传输技术

为了解决 6G 全球通信的需求，本文开发了用于模型建立的生成型人工智能代理，并应用混合专家方法设计传输策略。通过结合多个专业组件的专业知识，并利用生成代理所提供的问题求解，验证了该方法在解决问题上的准确性和有效性。

Apr, 2024

远程监视的代理驱动生成语义通信

在 6G 时代，智能交通系统、数字孪生、远程监控有望成为普遍实践。为了解决无线网络中庞大数据量和频繁更新的挑战，本文提出了一种基于强化学习的新型代理驱动生成语义通信（A-GSC）框架。通过无缝地结合源信息的内在属性和任务相关的情境信息，本研究在语义通信领域进行了创新，同时引入了生成人工智能（GAI），实现了语义编码器和解码器的独立设计。在实证分析中，基于 CDNet2014 数据集验证了所设计模型的有效性，并证明了整体 A-GSC 框架在节能和重构准确性方面的性能提升。

Apr, 2024

Sora 作为 AGI 世界模型？关于文本转视频生成的全面调查

文本到视频生成技术的进展与 Sora 模型的发展路径和应用，以及技术挑战与未来改进方向进行全面探讨，旨在促进文本到视频生成领域的创新与讨论。

Mar, 2024

Lyfe Agents: 低成本实时社交互动的生成代理

利用 Lyfe Agents 实现了高度自治生成智能代理，能够在虚拟社会中模拟复杂的社交行为，并能以低计算成本与人进行实时互动，通过自主协作和信息交流解决犯罪等问题，同时比现有替代方案的计算成本低 10-100 倍。

Oct, 2023