Jul, 2023
一个具有规划、长期上下文理解和程序综合的现实世界 Web 代理
A Real-World WebAgent with Planning, Long Context Understanding, and Program Synthesis
Izzeddin Gur, Hiroki Furuta, Austin Huang, Mustafa Safdari, Yutaka Matsuo...
TL;DR基于大规模语言模型的 WebAgent 在网页导航任务中通过规划和总结 HTML 文档,以 Python 程序的形式实现自然语言指令,实验结果显示成功率提升了 50% 以上,并且 HTML-T5 模型在解决基于 HTML 的任务上表现最好。