RestGPT: 通过 RESTful API 连接大型语言模型与实际应用
通过引入 ToolLLM,一个包括数据构建、模型训练和评估的通用工具使用框架,我们展示了它在增强自然语言模型的规划和推理能力方面的显著影响。我们通过用 ChatGPT 创建一个工具使用指导数据集 ToolBench,并使用深度优先搜索决策树(DFSDT)扩展搜索空间,有效地获取有效的解决方案路径。通过对 LLaMA 进行微调后得到 ToolLLaMA,我们的评估器 ToolEval 显示 ToolLLaMA 在执行复杂指令和推广到未见过的 API 方面表现出卓越的能力,并与 ChatGPT 有着相当的性能。为了使流程更加实用,我们设计了一个神经 API 检索器以为每个指令推荐适当的 API,省去了手动选择 API 的繁琐步骤。
Jul, 2023
该论文介绍了一个综合框架,旨在增强基于大型语言模型的代理在实际系统中的任务规划和工具使用能力,通过 API 检索器选择相关 API、LLM 精调器调整基础 LLM 以增强规划和 API 调用能力、以及演示选择器用于区分难以辨别的 API 并进行上下文学习,验证结果显示每个组件及整合框架的有效性。
Nov, 2023
通过使用 Large Language Models (LLMs),我们提出了 ModelGPT 框架,以满足用户的特定需求,并以更快的速度生成定制化的 AI 模型,以实现更加便利和用户友好的人工智能模型。
Feb, 2024
使用开源的大型语言模型,以摘要和向量相似性搜索的方式,提供无监督的技能提取和标准化 SES 处理工具 SkillGPT。
Apr, 2023
DB-GPT 是一款现成的 Python 库,将大型语言模型(LLMs)与传统数据交互任务相结合,以增强用户体验和可访问性。它支持各种环境部署,并能够处理包括基本的文本到 SQL 转换以及生成式数据分析等复杂任务。此外,DB-GPT 还提供一系列产品功能,以方便用户将其集成到产品环境中。
Apr, 2024
LLMs like GPT-4 show exceptional cross-domain understanding and reasoning for embedded systems development, producing fully correct programs, functional interfaces, register-level drivers, code for LoRa communication, and context-specific power optimizations, resulting in improved productivity and success rate using an AI workflow.
Jul, 2023
通过识别用户提示背后的意图,我们调查了一种基于 GPT 的意图推理方法,以简化大型语言模型(LLMs)的工具选择,从而提高系统的效率。通过在运行时缩小任务执行所需的 API 工具集合,我们将记号消耗减少了多达 24.6%。在一个具有 100 个 GPT-4-Turbo 节点的实际大规模并行 Copilot 平台上的初步结果显示出成本的降低和改善 LLM 系统效率的潜力。
Apr, 2024
该研究分析了使用大型语言模型的成本,并提出了三种降低推理成本的策略,包括提示适应,LLM 近似和 LLM 级联。 基于这些策略,我们提出了 FrugalGPT,它可以使用不同的组合来降低成本并提高准确性。
May, 2023
为了提高城市规划专业人员的效率并克服相关挑战,我们介绍了 PlanGPT,这是首个专门为城市和空间规划定制的大型语言模型。PlanGPT 通过与中国城市规划学会等机构的合作,利用自定义的本地数据库检索框架、基础模型的领域特定微调和先进的工具能力进行开发。经验证实,PlanGPT 在城市规划的复杂性上取得了卓越的性能,提供了精确适配城市规划细节的高质量响应。
Feb, 2024
通过对 GPT-4 在规划子领域中的表现进行全面检查,我们鉴定了大型语言模型在解决规划问题方面的优势和限制,并提出了改进领域特定大型语言模型的思维链能力的方法。这些结果为大语言模型在规划领域的潜在应用提供了宝贵的见解,并为未来的研究克服其限制和拓展其能力铺平了道路。
Sep, 2023