利用 Transformer 将 Epic/Story 转换为伪代码
通过从 arXiv 论文中提取近 320,000 个伪代码示例,我们创建了一个庞大的伪代码集合。我们的方法包括一个定制化的提取机制和一个基于随机抽样的验证机制,以优化覆盖范围并检查准确性和可靠性。同时,通过聚类和统计分析,我们提供了对常见伪代码结构的洞察,表明伪代码的使用呈现出指数型增长,凸显其不断增加的重要性。
Jun, 2024
该论文提出通过迭代回译的方法,借助已有的高资源编程语言(C++)的代码 - 伪代码数据,将训练好的 C++-to - 伪代码模型迁移到没有对应数据的遗留编程语言(C)上,从而实现对其代码的自动描述,取得了 23.27% 的成功率提升。
Mar, 2023
User Story Tutor (UST) 是一个检查用户故事描述可读性、提供改进建议、使用机器学习技术估计用户故事工作量的 Web 应用程序,可用于敏捷开发团队继续教育和增强当前用户故事创建的有效技术。
Jun, 2024
本文研究了如何使用 Transformers 提取和利用源代码中的句法信息,完成代码自动补全、函数命名和 bug 修复等任务,实现了更好的模型性能。
Oct, 2020
本文介绍了一种将 Scheherazade 故事意图图转换成人物 NLG 引擎所需输入的自动方法,使用 36 个 Aesop 寓言进行测试,结果表明我们可以生成正确内容,平均与 Scheherazade 实现器的输出接近。
Aug, 2017
本研究使用深度学习方法,基于单个输入图像,在三个不同平台(即 iOS、Android 和基于 web 的技术)中以超过 77% 的精度自动生成代码。
May, 2017
本研究探索了一种新型的粗粒度到细粒度的模型,可以生成故事文本,并通过抽象行为和实体来分解故事,生成谓词 - 参数结构的文本,最终替换实体占位符。经过广泛的分析和人工评估,我们的方法可以提高生成的故事中事件和实体的多样性和连贯性。
Feb, 2019
本文研究了在 IDE 中使用机器学习代码生成 / 检索技术对开发工作流程和体验产生的影响,设计了一款混合代码生成和检索的插件,并通过用户测试发现虽然开发者的体验得到了改善,但是对于提高生产率、代码质量和程序正确性等方面的具体效果并不确定,同时分析了需要改进的地方和开发者偏好。
Jan, 2021