通过多次深入讨论实现自动评论生成
本文探讨了自然语言生成的技术,并提出了基于 “读 - 关注 - 评价” 流程的新闻评论自动化生成方法,通过阅读网络和生成网络来理解新闻文章并生成评论。实验结果表明,该模型在自动评估和人类判断方面明显优于现有方法。
Sep, 2019
本文提出了一种基于 IR 技术和模板的 API 注释生成方法。该方法将机器翻译模型迁移到注释生成任务中并且通过引入仅对模板执行的代码生成步骤,使模型更加准确。在 Java 程序员中取得了 state-of-the-art 的回归结果。
Oct, 2020
本研究提出了一种基于交叉修改注意力的两次解码框架,用于图像描述生成任务。 通过在 Deliberation Model 中集成 CMA 模块,可以过滤掉从 Drafting Model 获取的错误信息并增强图像特征的语义表达能力,从而提高了生成文本描述的质量。 在 MS COCO 数据集上进行的实验表明,我们的方法相较于现有的单次解码和其他基于两次解码的方法,有显著的性能提升。
Sep, 2021
本文提出 APIContext2Com,利用预定义的 API 上下文来改善自动生成的代码注释的效果,介绍一种序列到序列编码器 - 解码器神经网络模型,它能够有效地将不同的输入转换为目标注释,并开发了一种排名机制来排除无关的 API。作者在 CodeSearchNet 数据集上评估了该方法,发现在 BLEU1、BLEU2、BLEU3、BLEU4、METEOR 和 ROUGE-L 方面分别提高了 1.88(8.24%)、2.16(17.58%)、1.38(18.3%)、0.73(14.17%)、1.58(14.98%)和 1.9(6.92%),同时作者进行人体评估和消融研究确认了该方法的有效性和架构和排名 API 的影响。
Mar, 2023
该研究提出了一种有效的提示方法,通过随机波束搜索融合自我评估指导,可以平衡生成链的质量 - 多样性权衡,并在少次学习的情况下,分别在 GSM8K、AQUA 和 StrategyQA 基准测试中比相应的 Codex-backboned 基线高出 6.34%、9.56%和 5.46%的准确度,同时通过细粒度推理又找到并解决了逻辑失误的问题,提高了一致性和鲁棒性。
May, 2023
本文提出一种通过学习不同的自然语言表征和代码表征之间的关系,生成一系列编辑操作来更新现有自然语言注释的方法,并在开源软件项目集合上进行多个实验和对比,结果表明该模型性能优于其他算法。
Apr, 2020
本文提出了一种名为 COMPCODER 的三阶段编译反馈机制,采用编译器反馈来生成可编译的代码,实验结果显示该方法的成功编译率从 44.18%提升至 89.18%。
Mar, 2022
提出了一种针对评论内容的自动生成模型,采用读者感知的主题建模和显著信息检测框架,生成多样化和有信息量的评论,并在三个数据集上取得了优于现有基线方法的结果。
Feb, 2021