h2oGPT：大规模语言模型的民主化

Jun, 2023

h2oGPT: Democratizing Large Language Models

Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick...

TL;DR介绍了一种基于 h2oGPT 平台的开源语言模型，旨在创建开源的比闭源 GPT 更好的大型语言模型，这将促进 AI 的发展并使其更加可靠和透明。

Abstract

Foundation large language models (LLMs) such as GPT-4 represent a revolution in AI due to their real-world applications though natural language processing. However, they also pose many significant risks such as t

large language models h2ogpt open-source natural language processing ai development

发现论文，激发创造

H2O 开放生态系统用于最先进的大型语言模型

介绍了一个完整的开源生态系统，用于开发和测试大型语言模型，目标是促进开放式替代闭源方法，通过 h2oGPT 和 H2O LLM Studio 提供基于 Apache 2.0 许可的代码和模型，以便更好地发展和访问 AI。

Oct, 2023

FinGPT: 开源金融领域大型语言模型

本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型（FinGPT），通过自动数据处理管道和低秩度量适应技术，为研究人员和从业者提供访问、透明的资源，并展示了机器人顾问、算法交易和低代码开发等潜在应用。

Jun, 2023

GPT4All：一个开源压缩语言模型生态系统

本研究论文通过介绍 GPT4All 技术细节和该项目的发展历程，旨在提供大规模语言模型的开放源代码和技术报告，以便实现 LLMs 的普及化和开放化。

Nov, 2023

用戶友好且開源的大型 GPT 模型的研究：對語言、多模態和科學 GPT 模型的調查

通过本综述论文，我们对大规模 GPT 模型的可替代开源模型进行了研究，重点关注用户友好和相对小型的模型，以促进更容易部署和访问。通过这个广泛的调查，我们旨在为研究人员、实践者和爱好者提供对大规模 GPT 模型的用户友好和相对小型的开源模型的深入了解，包括它们的当前状态、挑战和未来研究方向，以激发更高效、易于访问和多功能的 GPT 模型的开发，以满足更广泛的科学界需求，推动通用人工智能领域的发展。

Aug, 2023

揭开 ChatGPT：跟踪指导调整的文本生成器中的开放性、透明度和问责制

本文简要回顾了 OpenAI 的 ChatGPT 及其开源类似项目，并评估它们在代码可访问性、数据、许可证、训练以及 fine-tuning 等方面的开放程度。我们发现，尽管有许多声称为 “开源” 的项目，但是其中大部分存在不确定的数据来源以及缺乏充分的文档说明，缺少重要的注释调整，有意识的科学文档非常罕见，而这些因素在公平性和责任性方面都显得非常重要。

Jul, 2023

ChatGPT 的一周年：开源大规模语言模型是否在迎头赶上？

2022 年底，ChatGPT 的发布在 AI 的研究和商业领域引发了巨大的风潮，通过使用监督微调和强化学习来对大型语言模型进行指令调优，它展示了模型能够回答人类提出的问题并按照广泛的任务进行指令遵循，使得大型语言模型的研究兴趣得到了极大的加强，各种新的大型语言模型层出不穷，包括很多专注于大型语言模型的初创公司。然而，尽管封闭源的大型语言模型（如 OpenAI 的 GPT 和 Anthropic 的 Claude）通常表现出色，但开源大型语言模型的进展也非常迅速，并声称在某些任务上实现了与 ChatGPT 持平甚至更好的结果，这对于研究和商业都具有重要的意义。在本研究中，我们在 ChatGPT 发布一周年之际，全面概述了这一成就，并调查了所有开源大型语言模型声称在各项任务中达到与 ChatGPT 持平或更好的情况。

Nov, 2023

开源大型语言模型在文本注释任务中胜过众包工作者并接近 ChatGPT

研究比较了开源的大型语言模型（LLMs），ChatGPT 和人工服务（如 MTurk）在文本标注任务中的表现。发现开源 LLMs 在高效性，透明性，可再现性和数据保护方面具有竞争力，虽然 ChatGPT 在大多数任务中表现最好，但开源 LLMs 在特定任务中也有较高的竞争潜力。

Jul, 2023

大型语言模型

这篇研究论文探讨了人工智能领域的语言模型发展及近期成果，重点介绍了基于变压器架构的大型语言模型的工作原理，以及这些预测模型如何展现出类人的智能水平。

Jul, 2023

比较 GPT-4 和开源语言模型在虚假信息防范中的应用

本研究从大语言模型在辨别虚假信息方面的应用出发，探讨了 GPT-4、Zephyr-7b 等模型的优劣，并指出开源模型逐渐在该任务上赶超其他模型，同时呈现出 GPT-3.5 性能不稳定的现象。研究还验证了结构化输出方法和最新版本的 GPT-4（Turbo），证明它们在性能上没有妥协，从而为未来研究解锁了更复杂的虚假信息缓解管道。

Jan, 2024

FinGPT: 金融大型语言模型的互联网规模数据民主化

金融行业中，大型语言模型（LLMs）表现出了非凡的水平，在理解和生成类似人类的文本方面具有巨大的潜力，然而，现有的 LLMs 在金融领域中存在不足之处，这主要归因于一般文本数据和金融文本数据之间的差异。为了解决这个问题，我们引入了一种开源数据为中心的框架 —— 金融生成预训练 Transformer（FinGPT），通过自动收集和筛选来自互联网上的实时金融数据，为研究人员和从业人员提供了开放和透明的资源，以开发他们的 FinLLMs。此外，我们提出了一种简单而有效的策略，即使用市场的内在反馈进行 FinLLM 的精细调整，称为股票价格强化学习（RLSP）。最后，我们展示了几种 FinGPT 的应用，包括机器顾问，算法交易的情感分析以及低代码开发。FinGPT 旨在民主化金融领域的 LLMs，激发创新，并在开放金融领域中开启新的机会。

Jul, 2023