利用自然语言处理技术实现 API 代码摘要

Aug, 2022

利用自然语言处理技术实现 API 代码摘要

Towards Code Summarization of APIs Using NLP Techniques

AmirHossein Naghshzan

TL;DR本研究提出了一种使用自然语言处理技术通过非官方文档生成 API 和方法摘要的自动化方法，该方法可以作为指导开发人员进行软件开发和维护任务的补充来源。

Abstract

Each programming language comes with official documentation to guide developers with APIs, methods and classes. However, in some cases, official documentation is not an efficient way to get the needed information

programming language official documentation api nlp techniques software development

发现论文，激发创造

通过摘要将 API 文档彻底改革

本研究通过利用 Stack Overflow 的大量用户生成内容，包括代码片段和讨论，使用 BERTopic 和抽取式摘要生成简洁且信息丰富的 API 摘要，以解决解释应用程序编程接口 (API) 文档的挑战，这是软件开发的一个重要方面。这些摘要包括了关于常规使用方法、常见开发者问题和潜在解决方案等关键见解，以从 Stack Overflow 的丰富知识中获取。软件开发人员评估这些摘要的性能、连贯性和互操作性，为我们的方法的实用性提供有价值的反馈。

Jan, 2024

通过 BERTopic 建模和摘要提升 API 文档

本文介绍了一种独特的方法来解决对应用程序接口（API）文档的解释复杂性的需求，利用 BERTopic 的强项和自然语言处理（NLP）自动生成 API 文档的摘要，以提高 API 文档的可理解性和开发效率。研究结果揭示了重要主题，常见问题和潜在解决方案，旨在为开发人员提供实用工具以提升软件开发流程。

Aug, 2023

利用深度学习对非官方文档进行抽象代码摘要

本文提出了一种使用 BART 算法的自动方法，通过深度学习技术，在 StackOverflow 上生成 API 的摘要，并使用 ROUGE 和 BLEU 指标对其进行评估，结果表明使用深度学习算法可以提高摘要的质量，并且在精确率、召回率和 F-measure 上表现出色，且运行速度为之前的工作的 4.4 倍。

Oct, 2023

一种生成程序子程序自然语言摘要的神经模型

本研究提出了一种新的神经网络模型，它可以将源代码的单词和代码结构（AST）结合起来，从而能够生成准确的注释文档。与传统的基于模板的系统不同，该模型可以更好地学习代码结构，即使程序缺乏内部文档，也可以在演示中提供连贯的描述，并在 SE 文献和 NLP 文献中得到进一步的改进和应用验证。

Feb, 2019

使用图神经网络改进代码摘要

本文提出了一种使用图神经网络的自动代码注释生成方法，该方法使用了源代码序列和图结构信息作为输入，使用 210 万个 Java 方法 - 注释对进行评估，并表明比四种基线技术均有所改进。

Apr, 2020

代码摘要的大型语言模型

最近，使用深度学习进行软件工程方面的任务，包括代码生成和摘要等，出现了越来越多的活动。尤其是最新的编码大型语言模型在这些问题上表现良好。在本技术报告中，我们旨在回顾这些模型在代码解释 / 摘要方面的性能，同时调查它们基于自然语言描述的代码生成能力。

May, 2024

探索大型语言模型用于代码解释

使用各种大型语言模型自动生成代码片段的自然语言摘要，研究结果表明，代码语言模型优于其通用模型，而零 - shot 方法在训练集和测试集之间分布不同的数据集上取得了更好的结果。

Oct, 2023

自动代码摘要：一项系统性文献综述

本文对程序理解领域中自动代码摘要的现状进行了系统文献综述，着重调研数据提取技术、描述生成方法、评估方法和相关工具，从而深入阐述了目前的自动代码摘要方法，为未来程序理解与注释生成的研究提供了方向。

Sep, 2019

从 API 规格书生成自然语言句子

本文介绍了一种将 APIs 与聊天机器人相融合的方案，旨在帮助缺乏技术能力的业务用户实现自动化解决方案。文中提出了一种生成句子训练意图识别模型的系统，并使用深度学习模型进行评估，结果显示很有前景，在系统中引入人的参与将进一步提高系统性能。

Jun, 2022

一种源代码摘要的抽取和生成框架

本研究提出了一种新的抽取式 - 生成式混合框架来自动生成代码摘要，该框架结合了抽取式方法和生成式方法，能够提取关键的事实性细节，并生成简明、类似于人工撰写的自然语言摘要，实验证明 EACS 显著优于现有的技术，包括 BLEU，METEOR 和 ROUGH-L 等三个广泛使用的评估指标。

Jun, 2022