通过多次深入讨论实现自动评论生成

Sep, 2022

通过多次深入讨论实现自动评论生成

Automatic Comment Generation via Multi-Pass Deliberation

Fangwen Mu, Xiao Chen, Lin Shi, Song Wang, Qing Wang

TL;DRDECOM 是一种多通道决策框架，用于自动生成代码评论，并通过评估模型检测评论的质量，实验结果证明 DECOM 产生的评论更可读、信息量更大和更有用。

Abstract

deliberation is a common and natural behavior in human daily life. For example, when writing papers or articles, we usually first write drafts, and then iteratively polish them until satisfied. In light of such a human cognitive process, we propose →

deliberation decom comment generation code snippets evaluation model

发现论文，激发创造

阅读、参考和评论：用于自动新闻评论的深度架构

本文探讨了自然语言生成的技术，并提出了基于 “读 - 关注 - 评价” 流程的新闻评论自动化生成方法，通过阅读网络和生成网络来理解新闻文章并生成评论。实验结果表明，该模型在自动评估和人类判断方面明显优于现有方法。

Sep, 2019

检索和优化：基于示例的神经评论生成

本文提出了一种基于 IR 技术和模板的 API 注释生成方法。该方法将机器翻译模型迁移到注释生成任务中并且通过引入仅对模板执行的代码生成步骤，使模型更加准确。在 Java 程序员中取得了 state-of-the-art 的回归结果。

Oct, 2020

基于交叉修改的注意力推理模型用于图像字幕生成

本研究提出了一种基于交叉修改注意力的两次解码框架，用于图像描述生成任务。通过在 Deliberation Model 中集成 CMA 模块，可以过滤掉从 Drafting Model 获取的错误信息并增强图像特征的语义表达能力，从而提高了生成文本描述的质量。在 MS COCO 数据集上进行的实验表明，我们的方法相较于现有的单次解码和其他基于两次解码的方法，有显著的性能提升。

Sep, 2021

自动文章评论：任务和数据集

本文介绍了自动评论任务的提出和拥有数百万真实评论和人工标注的子集的大规模中文数据集，并开发了考虑评论质量与人类评估相关性的自动度量标准。

May, 2018

自然逻辑枢轴的评论：通过评论角度改进代码生成

借助注释作为代码 LLMs 生成能力的增强策略，MANGO 显著提高了代码通过率，并且逻辑注释解码策略的鲁棒性明显高于思路链引导。

Apr, 2024

APIContext2Com: 将预定义 API 文档纳入考虑的代码注释生成

本文提出 APIContext2Com，利用预定义的 API 上下文来改善自动生成的代码注释的效果，介绍一种序列到序列编码器 - 解码器神经网络模型，它能够有效地将不同的输入转换为目标注释，并开发了一种排名机制来排除无关的 API。作者在 CodeSearchNet 数据集上评估了该方法，发现在 BLEU1、BLEU2、BLEU3、BLEU4、METEOR 和 ROUGE-L 方面分别提高了 1.88（8.24％）、2.16（17.58％）、1.38（18.3％）、0.73（14.17％）、1.58（14.98％）和 1.9（6.92％），同时作者进行人体评估和消融研究确认了该方法的有效性和架构和排名 API 的影响。

Mar, 2023

通过自我评估引导解码的分解增强推理

该研究提出了一种有效的提示方法，通过随机波束搜索融合自我评估指导，可以平衡生成链的质量 - 多样性权衡，并在少次学习的情况下，分别在 GSM8K、AQUA 和 StrategyQA 基准测试中比相应的 Codex-backboned 基线高出 6.34％、9.56％和 5.46％的准确度，同时通过细粒度推理又找到并解决了逻辑失误的问题，提高了一致性和鲁棒性。

May, 2023

基于代码更改的自然语言注释更新学习

本文提出一种通过学习不同的自然语言表征和代码表征之间的关系，生成一系列编辑操作来更新现有自然语言注释的方法，并在开源软件项目集合上进行多个实验和对比，结果表明该模型性能优于其他算法。

Apr, 2020

具备编译器反馈的可编译神经代码生成

本文提出了一种名为 COMPCODER 的三阶段编译反馈机制，采用编译器反馈来生成可编译的代码，实验结果显示该方法的成功编译率从 44.18％提升至 89.18％。

Mar, 2022

通过读者感知主题建模和显著性检测生成多样化评论

提出了一种针对评论内容的自动生成模型，采用读者感知的主题建模和显著信息检测框架，生成多样化和有信息量的评论，并在三个数据集上取得了优于现有基线方法的结果。

Feb, 2021