BriefGPT.xyz
Ask
alpha
关键词
web agents
搜索结果 - 4
WebCanvas:在线环境下对网络代理进行基准测试
WebCanvas 是一种创新的在线评估框架,用于有效解决 Web 交互的动态特性,包含评估指标、基准数据集和注释工具,并开源了可进行在线推理和评估的代理框架。
PDF
18 days ago
WIPI:基于 LLM 的网络代理新威胁
LLM 驱动的 Web Agents(英语简写为 Web Agents)因其在像人脑一样通过多种网络工具与外部部署的网站进行积极互动时,具备强大的能力而备受关注。本文介绍了一种名为 WIPI 的新型威胁,其通过间接控制 Web Agents
→
PDF
4 months ago
关于面向对话式网络代理的多轮指令遵循
本文介绍了一种名为 Conversational Web Navigation 的新任务,通过使用名为 Multi-Turn Mind2Web (MT-Mind2Web) 的特殊数据集,提出了一种名为 self-reflective mem
→
PDF
4 months ago
WebVoyager: 使用大型多模态模型构建端到端网络代理
我们介绍了 WebVoyager,这是一种创新的大型多模态模型(LMM)驱动的网络代理,可以通过与真实网站的交互来完成用户指令的端到端。此外,我们提出了一种新的网络代理评估协议,以解决开放式网络代理任务的自动评估挑战,利用了 GPT-4V
→
PDF
5 months ago
Prev
Next