BriefGPT.xyz
Ask
alpha
关键词
commaqa benchmark
搜索结果 - 1
ACL
嗨,AI,你能通过与代理人对话解决复杂任务吗?
为了解决模型训练的数据和资源浪费问题,本文提出了一项新的挑战 —— 通过自然语言与现有智能体通信以完成复杂任务。通过设计一个综合性的基准测试 ——CommaQA,该基准测试包括三项复杂的推理任务,旨在通过与现有的 QA 智能体进行沟通来解决
→
PDF
3 years ago
Prev
Next