基于大语言模型的 YAML 信息技术任务自动生成
利用生成式 LLM 将人类描述转化为代码,本文研究生成和管理 Ansible YAML 角色和 playbooks 的解决方案,聚焦于可行的发展方向和潜在的工业应用。
Sep, 2023
Red Hat Ansible Lightspeed with IBM Watson Code Assistant is an LLM-based service that generates natural language to Ansible code. The analysis shows higher user acceptance rates compared to general-purpose tools, leading to positive user feedback and retention.
Feb, 2024
大型语言模型在自然语言到代码生成方面展现出卓越的性能,在通用领域语言(如 C++、Java 和 Python)上表现出最先进的性能。但是,在面向特定领域的结构化语言(如 YAML、JSON)上,它们的实际使用受到限制。为了克服这个挑战,我们提出了 DocCGen 框架,通过将结构化代码语言的自然语言到代码生成任务分为两步处理。通过从库文档中提取的模式规则对解码进行约束,我们的框架在两个复杂的结构化语言(Ansible YAML 和 Bash 命令)上不断改进不同规模的语言模型,并降低了结构化代码中的语法和语义错误。我们计划开源数据集和代码以促进受限制代码生成的研究。
Jun, 2024
本文研究了利用大型语言模型进行自然语言生成的能力,并应用于编程课程中常见的两种学习资源的制作。研究发现,在创建编程练习时,只需要输入关键词,即可显著影响编程概念和上下文主题的内容,同时也证明了大多数自动生成的内容是全新且合理的。这些结果表明,使用大型生成机器学习模型作为教学工具是有重要价值的,但在交付给学生之前需要一些监督来确保生成的内容质量。文章还探讨了 OpenAI Codex 及类似工具对初学者编程教育的影响,并强调了可能改善教学体验的未来研究方向。
Jun, 2022
基础设施即代码(IaC)是一种在产业中获得显著重视的革命性方法,该方法通过使用机器可读代码来管理和提供 IT 基础设施,实现自动化、环境一致性、可重复性、版本控制、错误减少和可伸缩性提升。本研究调查了使用大型语言模型(LLMs)来解决自动生成 IaC 配置的问题的可行性,并深入探讨了 IaC 的细节、不同平台上的使用、挑战以及 LLMs 在代码生成方面的重要性,同时提出了这一领域的挑战并强调了未来研究的范围。
Mar, 2024
该研究论文综述了自然语言处理技术的利用,重点关注使用大型代码训练的基于 Transformer 的大型语言模型在 AI 辅助编程任务领域中的应用。这些模型在包括代码生成、代码补全、代码翻译、代码概述、缺陷检测和克隆检测等 AI 辅助编程应用中扮演着关键角色,而其中值得注意的例子包括由 OpenAI 的 Codex 和 DeepMind AlphaCode 提供支持的 GitHub Copilot。本文概述了主要的大型语言模型及其在与 AI 辅助编程相关的下游任务中的应用,并探讨了在这些应用中结合 NLP 技术和软件自然性面临的挑战和机遇,同时讨论了将 AI 辅助编程能力拓展到苹果的 Xcode 移动软件开发环境中的问题和机会,以使开发人员能够获得更先进的编码辅助,并使软件开发流程更加高效。
Jul, 2023
研究 ChatGPT 3.5 模型在编写代码方面的能力,评估其在 10 种编程语言和 4 个软件领域中生成代码片段的熟练程度,并发现了模型的主要意外行为和限制,旨在寻找发展的潜在领域,并检查自动生成代码对编程语言和技术行业发展的影响。
Aug, 2023
利用大型语言模型的语义知识生成针对数据的问题和相应的代码,通过实证研究表明嵌入可以有效地用于过滤语义不相符的问题和代码对,并发现生成问题和代码可以产生更多样的问题。
Mar, 2024
利用大语言模型从自然语言查询生成任务特定代码的一种新方法,解决了网络管理中的可解释性、可扩展性和隐私问题,并且展示了高准确性、成本效益和进一步增强的潜力。
Aug, 2023
本研究对基于大型语言模型的对话 UI 进行了研究,目标是实现上下文感知的工具,该工具可以自动利用开发人员的编程上下文来回答问题。我们为用户提供了一个 IDE 插件,允许用户使用高级请求查询后端(例如 OpenAI 的 GPT-3.5 和 GPT-4),我们进行了 32 名参与者的探索性用户研究,研究确认这种方法比 Web 搜索更有效地帮助理解代码,但效果的差异因参与者的经验水平而异。
Jul, 2023