BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal agents
搜索结果 - 3
多模态代理的对抗攻击
基于视觉和语言的模型对自主多模态代理进行了攻击,展示了新的安全风险,并通过对抗性文本字符串指导基于梯度的扰动来执行对手目标。
PDF
16 days ago
OSWorld: 多模态代理在真实计算机环境中的开放式任务评测
通过引入 OSWorld,我们创建了一个包含 369 个计算机任务的基准,以评估多模态代理在开放领域中执行任意应用程序所涉及的计算机任务的能力。在 OSWorld 上进行的全面评估为开发多模态通用代理提供了宝贵的洞见,这是以前的基准测试无法
→
PDF
3 months ago
大型多模态代理:综述
大型语言模型在多媒体领域的研究和发展方向的全面回顾,介绍了大型多媒体代理的开发要素和分类,评估方法的编制以及未来研究方向的提出。
PDF
4 months ago
Prev
Next