BriefGPT.xyz
Ask
alpha
关键词
miniwob benchmark
搜索结果 - 1
WebAI 导航:使用大型语言模型和强化学习训练代理完成 Web 任务
该研究提出了一种将监督学习和强化学习技术相结合的新方法,通过在 MiniWoB 基准上利用两种方法的优势,解决了先前模型对 HTML 内容的理解上的关键限制,并展示了优于先前监督学习方法的实验结果,同时在与多模式强化学习方法相结合时缩小了与
→
PDF
2 months ago
Prev
Next