h2oGPT:大规模语言模型的民主化
介绍了一个完整的开源生态系统,用于开发和测试大型语言模型,目标是促进开放式替代闭源方法,通过 h2oGPT 和 H2O LLM Studio 提供基于 Apache 2.0 许可的代码和模型,以便更好地发展和访问 AI。
Oct, 2023
本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型(FinGPT),通过自动数据处理管道和低秩度量适应技术,为研究人员和从业者提供访问、透明的资源,并展示了机器人顾问、算法交易和低代码开发等潜在应用。
Jun, 2023
本研究论文通过介绍 GPT4All 技术细节和该项目的发展历程,旨在提供大规模语言模型的开放源代码和技术报告,以便实现 LLMs 的普及化和开放化。
Nov, 2023
通过本综述论文,我们对大规模 GPT 模型的可替代开源模型进行了研究,重点关注用户友好和相对小型的模型,以促进更容易部署和访问。通过这个广泛的调查,我们旨在为研究人员、实践者和爱好者提供对大规模 GPT 模型的用户友好和相对小型的开源模型的深入了解,包括它们的当前状态、挑战和未来研究方向,以激发更高效、易于访问和多功能的 GPT 模型的开发,以满足更广泛的科学界需求,推动通用人工智能领域的发展。
Aug, 2023
本文简要回顾了 OpenAI 的 ChatGPT 及其开源类似项目,并评估它们在代码可访问性、数据、许可证、训练以及 fine-tuning 等方面的开放程度。我们发现,尽管有许多声称为 “开源” 的项目,但是其中大部分存在不确定的数据来源以及缺乏充分的文档说明,缺少重要的注释调整,有意识的科学文档非常罕见,而这些因素在公平性和责任性方面都显得非常重要。
Jul, 2023
2022 年底,ChatGPT 的发布在 AI 的研究和商业领域引发了巨大的风潮,通过使用监督微调和强化学习来对大型语言模型进行指令调优,它展示了模型能够回答人类提出的问题并按照广泛的任务进行指令遵循,使得大型语言模型的研究兴趣得到了极大的加强,各种新的大型语言模型层出不穷,包括很多专注于大型语言模型的初创公司。然而,尽管封闭源的大型语言模型(如 OpenAI 的 GPT 和 Anthropic 的 Claude)通常表现出色,但开源大型语言模型的进展也非常迅速,并声称在某些任务上实现了与 ChatGPT 持平甚至更好的结果,这对于研究和商业都具有重要的意义。在本研究中,我们在 ChatGPT 发布一周年之际,全面概述了这一成就,并调查了所有开源大型语言模型声称在各项任务中达到与 ChatGPT 持平或更好的情况。
Nov, 2023
研究比较了开源的大型语言模型(LLMs),ChatGPT 和人工服务(如 MTurk)在文本标注任务中的表现。 发现开源 LLMs 在高效性,透明性,可再现性和数据保护方面具有竞争力,虽然 ChatGPT 在大多数任务中表现最好,但开源 LLMs 在特定任务中也有较高的竞争潜力。
Jul, 2023
本研究从大语言模型在辨别虚假信息方面的应用出发,探讨了 GPT-4、Zephyr-7b 等模型的优劣,并指出开源模型逐渐在该任务上赶超其他模型,同时呈现出 GPT-3.5 性能不稳定的现象。研究还验证了结构化输出方法和最新版本的 GPT-4(Turbo),证明它们在性能上没有妥协,从而为未来研究解锁了更复杂的虚假信息缓解管道。
Jan, 2024
金融行业中,大型语言模型(LLMs)表现出了非凡的水平,在理解和生成类似人类的文本方面具有巨大的潜力,然而,现有的 LLMs 在金融领域中存在不足之处,这主要归因于一般文本数据和金融文本数据之间的差异。为了解决这个问题,我们引入了一种开源数据为中心的框架 —— 金融生成预训练 Transformer(FinGPT),通过自动收集和筛选来自互联网上的实时金融数据,为研究人员和从业人员提供了开放和透明的资源,以开发他们的 FinLLMs。此外,我们提出了一种简单而有效的策略,即使用市场的内在反馈进行 FinLLM 的精细调整,称为股票价格强化学习(RLSP)。最后,我们展示了几种 FinGPT 的应用,包括机器顾问,算法交易的情感分析以及低代码开发。FinGPT 旨在民主化金融领域的 LLMs,激发创新,并在开放金融领域中开启新的机会。
Jul, 2023