章鱼 v4:语言模型之图
利用大型语言模型在软件 API 调用中的提高性能和准确性,通过编译和微调 API 结构和语法,使用条件屏蔽技术确保输出符合预期格式并减少错误率,提出了评估 LLM 在 API 互动中有效性的新基准,并证明了 fine-tuned 模型 Octopus 对于软件 API 调用具有比 GPT-4 更好的性能,推动自动化软件开发和 API 集成的发展,实现了 LLM 能力与实际软件工程应用需求的实质性进展。
Apr, 2024
我们的研究提出了一种新方法,通过使用 20 亿个参数的设备上模型,在准确率和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。与基于 RAG 的函数调用机制 Llama-7B 相比,我们的方法将延迟提高了 35 倍,降低到适用于实际生产环境中各种边缘设备部署的水平,符合真实应用的性能要求。
Apr, 2024
多模态 AI 代理通过处理和学习来自自然语言、视觉和音频输入的各种数据来指导行动,但将基于图像的数据转换为可操作结果仍然具有挑战性。本文介绍了一种多模态模型,其中包含专门为 AI 代理应用设计的功能令牌的概念,并优化为小于 1B 参数的紧凑尺寸,能够在各种边缘设备上高效运行,包括树莓派。
Apr, 2024
我们提出了一种新颖的阿拉伯文本到文本的 Transformer 模型 AraT5v2,通过使用大量和多样化的数据进行系统化训练,并探索了多种预训练策略,包括无监督、有监督和联合训练,在单任务和多任务设置下,超过了竞争基准,进一步开发了基于 Python 的 Octopus 工具包和命令行工具,专为八个阿拉伯生成任务定制,利用单个模型。我们在公开代码库上发布了这些模型和工具。
Oct, 2023
Octopus 是一种新颖的大视觉 - 语言模型,能够有效地解读代理的视觉和文本任务目标,并制定复杂的行动序列和生成可执行代码,通过开源模型结构、模拟器和数据集,旨在激发更多创新,并在更广泛的具身化人工智能社区中促进协作应用。
Oct, 2023
本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型(FinGPT),通过自动数据处理管道和低秩度量适应技术,为研究人员和从业者提供访问、透明的资源,并展示了机器人顾问、算法交易和低代码开发等潜在应用。
Jun, 2023
本研究论文通过介绍 GPT4All 技术细节和该项目的发展历程,旨在提供大规模语言模型的开放源代码和技术报告,以便实现 LLMs 的普及化和开放化。
Nov, 2023
介绍了一个完整的开源生态系统,用于开发和测试大型语言模型,目标是促进开放式替代闭源方法,通过 h2oGPT 和 H2O LLM Studio 提供基于 Apache 2.0 许可的代码和模型,以便更好地发展和访问 AI。
Oct, 2023
通过使用 GPT-4 对多个开源语言模型的反馈进行评估,本研究探讨了大型语言模型在教育领域中生成反馈的质量,并发现一些模型在性能上可以与专有的语言模型竞争,从而为其在教学环境中的负责任使用提供机会。
May, 2024