Jul, 2023

一个具有规划、长期上下文理解和程序综合的现实世界 Web 代理

TL;DR基于大规模语言模型的 WebAgent 在网页导航任务中通过规划和总结 HTML 文档,以 Python 程序的形式实现自然语言指令,实验结果显示成功率提升了 50% 以上,并且 HTML-T5 模型在解决基于 HTML 的任务上表现最好。