BriefGPT.xyz
Ask
alpha
关键词
execution feedback
搜索结果 - 2
ICLR
工具对话:在对话场景中评估工具使用
使用大型语言模型(LLMs)来拓展助手功能,提供对私人或最新信息的访问和用户代理人操作行为的量化评估工具,称为 ToolTalk。该工具包括 28 个工具和 7 个插件,模拟实现每个工具,并强调对外部世界产生影响的工具。通过在 GPT-3.
→
PDF
8 months ago
利用执行反馈提升语言模型对学习者的帮助
该研究主要介绍了一种名为 TRICE 的基于执行反馈的二阶段端到端框架,使语言模型通过从工具执行中得出的反馈不断学习,从而学习何时以及如何有效地使用工具,实验结果表明,TRICE 可以通过减少模型对工具的依赖性来选择性地使用工具,同时提高性
→
PDF
a year ago
Prev
Next