Pythia:AI 辅助的代码自动完成系统
本研究描述了一种在 JetBrains' IntelliJ 平台上构建的多标记代码补全功能,称为 Full Line Code Completion。该功能仅建议语法正确的代码,并在用户设备上完全本地工作,为用户提供更丰富的体验,同时快速、紧凑且安全。作者分享了一些满足开发限制的有用技术,并描述了离线和在线评估流程以帮助做出更好的决策。
May, 2024
本研究介绍了一个智能代码补全系统 PyReco,它使用来自公共代码库的 API 用法来区分推荐结果的相关性,以取代传统字母顺序,并使用最近邻分类器来识别最佳匹配用法,以提供相关工作环境的建议。该系统在十倍交叉验证技术下的定量测试中表现优于按字母顺序排列的 API 推荐系统,适用于标准和第三方库。
Aug, 2016
介绍了 16 个大小从 70M 到 12B 参数的大型语言模型套件 Pythia,旨在促进在语言模型和训练动态中的研究,包括记忆化、少样本性能的术语频率效应和减少性别偏见等方面的结果。
Apr, 2023
本文介绍了 IntelliCode Compose—— 一种通用的多语言代码自动完成工具,它可以预测任意类型的代码令牌序列,生成最多整行语法正确的代码。它利用了基于 1.2 亿行 Python、C#、JavaScript 和 TypeScript 编程语言源代码训练的最先进的生成式变换模型,在 Visual Studio Code IDE 和 Azure Notebook 中实现了按编辑时间完成建议要求的客户端树形缓存、高效的并行实现的波束搜索解码器和计算图优化。我们的最佳模型为 Python 编程语言提供了 86.7%的平均编辑相似度和 1.82 的困惑度。
May, 2020
基于 Transformer 的语言模型在自动代码补全方面显示出巨大的潜力,但是这些模型的评估很少使用真实数据。本研究提供了对三个公共代码语言模型在完成真实世界代码时的定量和定性评估。
Feb, 2024
本文提出了 PyCoder 代码补全模型,使用轻量级的句法信息 —— 标记类型,训练支持模型通过预测标记类型来提高模型预测代码内容的准确性,以此实现对语法信息的无需依赖,比 AST 等传统方法更加高效,在 CodeXGLUE 评测中取得了最好的成绩,模型已在 HuggingFace 平台上公开。
Nov, 2022
我们开发了一个机器学习模型,可以根据代码上下文和可用的遥测数据准确预测何时调用代码补全工具,该模型显著优于基准模型并在维持低延迟的同时集成了一些额外的遥测数据。
May, 2024
本文介绍了 PYTHIA 程序,这是一种在高能碰撞中生成事件的标准工具,包括硬过程的图书馆,动力学模型,初态和末态颗粒群射等,并为外部程序提供接口,这个第二个主要发布版本迎来了 PYTHIA 从 Fortran 到 C++ 的完全重写,并在很大程度上替代了大多数应用,特别是 LHC 物理研究。
Oct, 2014
本文提出的 Pythia v0.1 通过对模型架构、学习率调整、图像特征微调和数据增强进行优化,并使用不同数据集和特征训练多个模型集成实现了 VQA v2.0 数据集上 72.27% 的准确率,其中采用的 up-down 模型表现最好。
Jul, 2018
本研究探讨了 AI 支持的编程工具的现有局限性和未来发展挑战,从 Copilot 的代码建议语言习惯和代码气味方面进行了初步探索,同时提出了一个简单的分类工具来理解该领域的 AI 支持的 code completion 工具。
Mar, 2023