ChatGPT备选方案:大型语言模型调查
本研究评估了多语言文本处理技术的热门系统ChatGPT在37种不同的语言中进行的7项不同任务的表现,揭示了其在不同NLP任务和语言方面的表现与其他模型相比较差,需要进一步的研究来发展更好的模型和了解多语言学习。
Apr, 2023
本文提供一个关于使用大型语言模型(LLMs)处理自然语言处理(NLP)下游任务的全面指南,讨论了模型、数据和下游任务等方面的关键问题。同时提供了大量使用案例和非使用案例,以便于实现这些模型在各种NLP任务中的成功应用。
Apr, 2023
本文研究大型语言模型(LLMs)对人工智能研究的影响。通过以GPT3.5 / ChatGPT3.4和ChatGPT 4为例,我们展示这些模型具有什么样的功能,并且这些模型令人们瞩目的领域覆盖速度证明了这个趋势正在逐渐变成实现通用智能的强劲迹象。这些模型的创新也将随着这些人工智能系统的成熟而扩大,并将展示出在我们社会的多个方面具有重要影响的不可预见的应用。
May, 2023
ChatGPT是OpenAI创建的一种大型语言模型(LLM),通过大量数据的精心训练,推动了自然语言处理(NLP)的发展,并拓展了LLM的能力边界。本文主要目标是对ChatGPT及其演变的当前研究方向进行简明概述,提供了基于玻璃盒和黑盒观点的综合分析。此概述也揭示了LLM和GAI领域的现有和缺失研究方向,有益于公众用户和开发人员。
Jul, 2023
这篇研究论文总结了大型语言模型(LLMs)不同子类的最新发展,包括基于任务的金融LLMs、多语言LLMs、生物医学和临床LLMs,以及视觉语言LLMs和代码语言模型。它还强调了聊天机器人和虚拟助手开发领域中的未解决问题,如增强自然语言处理、提升聊天机器人智能性以及解决道德和法律困境,旨在为对基于LLMs的聊天机器人和虚拟智能助手技术感兴趣的读者、开发者、学者和用户提供有用的信息和未来方向。
Jul, 2023
2022年底,ChatGPT的发布在AI的研究和商业领域引发了巨大的风潮,通过使用监督微调和强化学习来对大型语言模型进行指令调优,它展示了模型能够回答人类提出的问题并按照广泛的任务进行指令遵循,使得大型语言模型的研究兴趣得到了极大的加强,各种新的大型语言模型层出不穷,包括很多专注于大型语言模型的初创公司。然而,尽管封闭源的大型语言模型(如OpenAI的GPT和Anthropic的Claude)通常表现出色,但开源大型语言模型的进展也非常迅速,并声称在某些任务上实现了与ChatGPT持平甚至更好的结果,这对于研究和商业都具有重要的意义。在本研究中,我们在ChatGPT发布一周年之际,全面概述了这一成就,并调查了所有开源大型语言模型声称在各项任务中达到与ChatGPT持平或更好的情况。
Nov, 2023
基于Transformer架构的大型语言模型(LLMs)的近期进展在自然语言处理(NLP)应用领域展示了显著的拓宽范围,超越了其在聊天机器人技术中的初始应用。本文探究了这些模型的多方面应用,重点关注GPT系列,对人工智能(AI)驱动工具在改变编码、问题解决等传统任务上起到的转变性影响进行了研究,同时开辟了在不同行业中进行研究和开发的新方向。从代码解释和图像描述到便于构建交互式系统和推动计算领域的发展,Transformer模型展示了深度学习、数据分析和神经网络设计相结合的协同作用。本调查报告深入了解了Transformer模型的最新研究,突出了其多功能性和在实际应用领域中转型的潜力,从而为读者提供了对Transformer-based LLMs在当前和未来实际应用领域的全面理解。
Mar, 2024
本文全面调查了基于大型语言模型(LLMs)的聊天机器人在各个领域的进化和部署,总结了基础聊天机器人发展、LLMs演进,并提供了当前正在使用和开发中的基于LLMs的聊天机器人概述。我们将AI聊天机器人视为生成新知识的工具,探讨了它们在各个行业中的多样应用。然后,我们讨论了一些挑战,包括训练LLMs使用的数据和生成知识的滥用可能引发的问题。最后,我们展望未来,探索如何提升它们在众多应用中的效率和可靠性。通过介绍LLMs-based聊天机器人的关键里程碑和当今背景,我们的调查邀请读者深入研究这一领域,并思考它们的下一代将如何重塑对话型人工智能。
Jun, 2024