章鱼 v4：语言模型之图

Apr, 2024

Octopus v4: Graph of language models

Wei Chen, Zhiyuan Li

TL;DR使用 extit {functional tokens} 和图作为数据结构，Octopus v4 模型整合多个开源模型，实现了更好的性能和选择参数的理解和重新格式化，达到了同级模型中最先进的 MMLU 得分 74.8。

Abstract

language models have been effective in a wide range of applications, yet the most sophisticated models are often proprietary. For example, GPT-4 by OpenAI and various models by Anthropic are expensive and consume substantial energy. In contrast, the open-source community has produced c

language models functional tokens open-source models octopus v4 model graph

发现论文，激发创造

八爪鱼：软件 API 函数调用的设备端语言模型

利用大型语言模型在软件 API 调用中的提高性能和准确性，通过编译和微调 API 结构和语法，使用条件屏蔽技术确保输出符合预期格式并减少错误率，提出了评估 LLM 在 API 互动中有效性的新基准，并证明了 fine-tuned 模型 Octopus 对于软件 API 调用具有比 GPT-4 更好的性能，推动自动化软件开发和 API 集成的发展，实现了 LLM 能力与实际软件工程应用需求的实质性进展。

Apr, 2024

八爪鱼 v2：面向超级特工的设备上语言模型

我们的研究提出了一种新方法，通过使用 20 亿个参数的设备上模型，在准确率和延迟方面超越了 GPT-4，并将上下文长度减少了 95％。与基于 RAG 的函数调用机制 Llama-7B 相比，我们的方法将延迟提高了 35 倍，降低到适用于实际生产环境中各种边缘设备部署的水平，符合真实应用的性能要求。

Apr, 2024

Octopus v3: 在设备上的亿级多模态人工智能代理的技术报告

多模态 AI 代理通过处理和学习来自自然语言、视觉和音频输入的各种数据来指导行动，但将基于图像的数据转换为可操作结果仍然具有挑战性。本文介绍了一种多模态模型，其中包含专门为 AI 代理应用设计的功能令牌的概念，并优化为小于 1B 参数的紧凑尺寸，能够在各种边缘设备上高效运行，包括树莓派。

Apr, 2024

h2oGPT：大规模语言模型的民主化

介绍了一种基于 h2oGPT 平台的开源语言模型，旨在创建开源的比闭源 GPT 更好的大型语言模型，这将促进 AI 的发展并使其更加可靠和透明。

Jun, 2023

章鱼：阿拉伯语自然语言生成的多任务模型和工具包

我们提出了一种新颖的阿拉伯文本到文本的 Transformer 模型 AraT5v2，通过使用大量和多样化的数据进行系统化训练，并探索了多种预训练策略，包括无监督、有监督和联合训练，在单任务和多任务设置下，超过了竞争基准，进一步开发了基于 Python 的 Octopus 工具包和命令行工具，专为八个阿拉伯生成任务定制，利用单个模型。我们在公开代码库上发布了这些模型和工具。

Oct, 2023

章鱼：基于环境反馈的视觉语言程序员

Octopus 是一种新颖的大视觉 - 语言模型，能够有效地解读代理的视觉和文本任务目标，并制定复杂的行动序列和生成可执行代码，通过开源模型结构、模拟器和数据集，旨在激发更多创新，并在更广泛的具身化人工智能社区中促进协作应用。

Oct, 2023

FinGPT: 开源金融领域大型语言模型

本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型（FinGPT），通过自动数据处理管道和低秩度量适应技术，为研究人员和从业者提供访问、透明的资源，并展示了机器人顾问、算法交易和低代码开发等潜在应用。

Jun, 2023

GPT4All：一个开源压缩语言模型生态系统

本研究论文通过介绍 GPT4All 技术细节和该项目的发展历程，旨在提供大规模语言模型的开放源代码和技术报告，以便实现 LLMs 的普及化和开放化。

Nov, 2023

H2O 开放生态系统用于最先进的大型语言模型

介绍了一个完整的开源生态系统，用于开发和测试大型语言模型，目标是促进开放式替代闭源方法，通过 h2oGPT 和 H2O LLM Studio 提供基于 Apache 2.0 许可的代码和模型，以便更好地发展和访问 AI。

Oct, 2023

开源语言模型的反馈能力评估：利用 GPT-4 作为评委帮助学生的能力

通过使用 GPT-4 对多个开源语言模型的反馈进行评估，本研究探讨了大型语言模型在教育领域中生成反馈的质量，并发现一些模型在性能上可以与专有的语言模型竞争，从而为其在教学环境中的负责任使用提供机会。

May, 2024