源代码人工智能调查:对话系统视角
该研究论文综述了自然语言处理技术的利用,重点关注使用大型代码训练的基于 Transformer 的大型语言模型在 AI 辅助编程任务领域中的应用。这些模型在包括代码生成、代码补全、代码翻译、代码概述、缺陷检测和克隆检测等 AI 辅助编程应用中扮演着关键角色,而其中值得注意的例子包括由 OpenAI 的 Codex 和 DeepMind AlphaCode 提供支持的 GitHub Copilot。本文概述了主要的大型语言模型及其在与 AI 辅助编程相关的下游任务中的应用,并探讨了在这些应用中结合 NLP 技术和软件自然性面临的挑战和机遇,同时讨论了将 AI 辅助编程能力拓展到苹果的 Xcode 移动软件开发环境中的问题和机会,以使开发人员能够获得更先进的编码辅助,并使软件开发流程更加高效。
Jul, 2023
本研究应用基于 AI 的代码助手对影响现代技术的一些重要代码进行分析,提出使用该助手工具可以对混淆代码或缺乏说明注释的软件提供见解,并专注于添加自动文档和代码注释,并将某些选定的大型代码库转换为带有多个新的 API 和多任务链接的现代版本,从而在遗留代码重构和高价值代码库功能简化方面提供了具有人类级别专业知识的有价值工具。
Jan, 2023
介绍了 “神经代码智能”(NCI)领域的基本情况,包括预训练技术、任务、数据集和模型结构;探讨了如何使用深度学习技术提高软件工程效率、减少人为错误,并为领域内未来研究提供启示。
Dec, 2022
本文综述了深度学习在编码智能方面的应用,包括代码表示学习、深度学习技术和应用任务,并提供了一个适用于基于深度学习的编码智能模型快速原型设计的开源工具包。同时,公开发布了源代码和数据资源,以促进现有和未来编码智能模型的评估和比较,并指出了几个具有挑战性和有前景的研究方向。
Dec, 2023
本文综述了机器学习、编程语言和软件工程交叉领域的研究进展,重点介绍了利用代码中大量存在的模式提出可学习概率模型的方法,并提出了基于每个模型的基本设计原理的分类法,用于研究该领域的技术、应用等方面的具体问题、挑战和机遇。
Sep, 2017
神经编码智能 - 利用深度学习理解、生成和优化代码 - 在整个社会中具有巨大的潜力。这篇调查综述了代码智能领域的技术进展,并系统地回顾了过去几年来研究社区对这一领域的关注。
Mar, 2024
本文旨在总结如何应用机器学习技术进行源代码分析的最新研究动态,并回顾 12 类软件工程任务及相应的机器学习技术、工具和数据集。在文献调研的基础上,文章总结了研究观察和发现,并总结了每个任务的通用步骤、机器学习技术和可用数据集和工具,并讨论了这一领域面临的各种挑战。
Oct, 2021