利用自然语言处理技术实现 API 代码摘要
本研究通过利用 Stack Overflow 的大量用户生成内容,包括代码片段和讨论,使用 BERTopic 和抽取式摘要生成简洁且信息丰富的 API 摘要,以解决解释应用程序编程接口 (API) 文档的挑战,这是软件开发的一个重要方面。这些摘要包括了关于常规使用方法、常见开发者问题和潜在解决方案等关键见解,以从 Stack Overflow 的丰富知识中获取。软件开发人员评估这些摘要的性能、连贯性和互操作性,为我们的方法的实用性提供有价值的反馈。
Jan, 2024
本文介绍了一种独特的方法来解决对应用程序接口(API)文档的解释复杂性的需求,利用 BERTopic 的强项和自然语言处理(NLP)自动生成 API 文档的摘要,以提高 API 文档的可理解性和开发效率。研究结果揭示了重要主题,常见问题和潜在解决方案,旨在为开发人员提供实用工具以提升软件开发流程。
Aug, 2023
本文提出了一种使用 BART 算法的自动方法,通过深度学习技术,在 StackOverflow 上生成 API 的摘要,并使用 ROUGE 和 BLEU 指标对其进行评估,结果表明使用深度学习算法可以提高摘要的质量,并且在精确率、召回率和 F-measure 上表现出色,且运行速度为之前的工作的 4.4 倍。
Oct, 2023
本研究提出了一种新的神经网络模型,它可以将源代码的单词和代码结构(AST)结合起来,从而能够生成准确的注释文档。与传统的基于模板的系统不同,该模型可以更好地学习代码结构,即使程序缺乏内部文档,也可以在演示中提供连贯的描述,并在 SE 文献和 NLP 文献中得到进一步的改进和应用验证。
Feb, 2019
本文提出了一种使用图神经网络的自动代码注释生成方法,该方法使用了源代码序列和图结构信息作为输入,使用 210 万个 Java 方法 - 注释对进行评估,并表明比四种基线技术均有所改进。
Apr, 2020
最近,使用深度学习进行软件工程方面的任务,包括代码生成和摘要等,出现了越来越多的活动。尤其是最新的编码大型语言模型在这些问题上表现良好。在本技术报告中,我们旨在回顾这些模型在代码解释 / 摘要方面的性能,同时调查它们基于自然语言描述的代码生成能力。
May, 2024
使用各种大型语言模型自动生成代码片段的自然语言摘要,研究结果表明,代码语言模型优于其通用模型,而零 - shot 方法在训练集和测试集之间分布不同的数据集上取得了更好的结果。
Oct, 2023
本文对程序理解领域中自动代码摘要的现状进行了系统文献综述,着重调研数据提取技术、描述生成方法、评估方法和相关工具,从而深入阐述了目前的自动代码摘要方法,为未来程序理解与注释生成的研究提供了方向。
Sep, 2019
本文介绍了一种将 APIs 与聊天机器人相融合的方案,旨在帮助缺乏技术能力的业务用户实现自动化解决方案。文中提出了一种生成句子训练意图识别模型的系统,并使用深度学习模型进行评估,结果显示很有前景,在系统中引入人的参与将进一步提高系统性能。
Jun, 2022
本研究提出了一种新的抽取式 - 生成式混合框架来自动生成代码摘要,该框架结合了抽取式方法和生成式方法,能够提取关键的事实性细节,并生成简明、类似于人工撰写的自然语言摘要,实验证明 EACS 显著优于现有的技术,包括 BLEU,METEOR 和 ROUGH-L 等三个广泛使用的评估指标。
Jun, 2022