Pythia：AI 辅助的代码自动完成系统

KDDNov, 2019

Pythia：AI 辅助的代码自动完成系统

Pythia: AI-assisted Code Completion System

Alexey Svyatkovskiy, Ying Zhao, Shengyu Fu, Neel Sundaresan

TL;DR本文提出了一种名为 Pythia 的人工智能辅助代码自动补全系统，利用深度学习模型从抽象语法树中提取代码背景信息，实现高准确度的代码自动补全推荐，适用于 Visual Studio Code IDE 等编辑环境，其准确度较传统方法高 20％左右。

Abstract

In this paper, we propose a novel end-to-end approach for AI-assisted code completion called pythia. It generates ranked lists of method and API recommendations which can be used by software developers at edit time. The system is currently deployed as part of Intellicode extension in V

ai-assisted code completion pythia deep learning visual studio code accuracy

发现论文，激发创造

全行代码自动补全：将 AI 引入桌面

本研究描述了一种在 JetBrains' IntelliJ 平台上构建的多标记代码补全功能，称为 Full Line Code Completion。该功能仅建议语法正确的代码，并在用户设备上完全本地工作，为用户提供更丰富的体验，同时快速、紧凑且安全。作者分享了一些满足开发限制的有用技术，并描述了离线和在线评估流程以帮助做出更好的决策。

May, 2024

Python 中用于更智能的 API 推荐的集体智能

本研究介绍了一个智能代码补全系统 PyReco，它使用来自公共代码库的 API 用法来区分推荐结果的相关性，以取代传统字母顺序，并使用最近邻分类器来识别最佳匹配用法，以提供相关工作环境的建议。该系统在十倍交叉验证技术下的定量测试中表现优于按字母顺序排列的 API 推荐系统，适用于标准和第三方库。

Aug, 2016

Pythia：用于分析大规模语言模型在训练和扩展方面的工具集

介绍了 16 个大小从 70M 到 12B 参数的大型语言模型套件 Pythia，旨在促进在语言模型和训练动态中的研究，包括记忆化、少样本性能的术语频率效应和减少性别偏见等方面的结果。

Apr, 2023

IntelliCode Compose：使用 Transformer 进行代码生成

本文介绍了 IntelliCode Compose—— 一种通用的多语言代码自动完成工具，它可以预测任意类型的代码令牌序列，生成最多整行语法正确的代码。它利用了基于 1.2 亿行 Python、C#、JavaScript 和 TypeScript 编程语言源代码训练的最先进的生成式变换模型，在 Visual Studio Code IDE 和 Azure Notebook 中实现了按编辑时间完成建议要求的客户端树形缓存、高效的并行实现的波束搜索解码器和计算图优化。我们的最佳模型为 Python 编程语言提供了 86.7％的平均编辑相似度和 1.82 的困惑度。

May, 2020

代码补全的语言模型：实践评估

基于 Transformer 的语言模型在自动代码补全方面显示出巨大的潜力，但是这些模型的评估很少使用真实数据。本研究提供了对三个公共代码语言模型在完成真实世界代码时的定量和定性评估。

Feb, 2024

语法感知的即时代码完成

本文提出了 PyCoder 代码补全模型，使用轻量级的句法信息 —— 标记类型，训练支持模型通过预测标记类型来提高模型预测代码内容的准确性，以此实现对语法信息的无需依赖，比 AST 等传统方法更加高效，在 CodeXGLUE 评测中取得了最好的成绩，模型已在 HuggingFace 平台上公开。

Nov, 2022

基于 Transformer 的智能调用自动代码完成方法

我们开发了一个机器学习模型，可以根据代码上下文和可用的遥测数据准确预测何时调用代码补全工具，该模型显著优于基准模型并在维持低延迟的同时集成了一些额外的遥测数据。

May, 2024

PYTHIA 8.2 简介

本文介绍了 PYTHIA 程序，这是一种在高能碰撞中生成事件的标准工具，包括硬过程的图书馆，动力学模型，初态和末态颗粒群射等，并为外部程序提供接口，这个第二个主要发布版本迎来了 PYTHIA 从 Fortran 到 C++ 的完全重写，并在很大程度上替代了大多数应用，特别是 LHC 物理研究。

Oct, 2014

Pythia v0.1：VQA Challenge 2018 获胜方案

本文提出的 Pythia v0.1 通过对模型架构、学习率调整、图像特征微调和数据增强进行优化，并使用不同数据集和特征训练多个模型集成实现了 VQA v2.0 数据集上 72.27% 的准确率，其中采用的 up-down 模型表现最好。

Jul, 2018

从 Copilot 到 Pilot：走向 AI 支持的软件开发

本研究探讨了 AI 支持的编程工具的现有局限性和未来发展挑战，从 Copilot 的代码建议语言习惯和代码气味方面进行了初步探索，同时提出了一个简单的分类工具来理解该领域的 AI 支持的 code completion 工具。

Mar, 2023