- MAGIS:基于 LLM 的 GitHub 问题解决多智能体框架
在软件演化中,解决 GitHub 存储库中的新出现问题是一个复杂的挑战。为了克服这些挑战,我们提出了一种基于大型语言模型(LLMs)的多智能体框架 MAGIS,它由四种定制化的代理人组成,通过规划和编码过程中的各种代理人的协作来发挥 LLM - 机器学习项目如何使用持续集成实践?基于 GitHub Actions 的实证研究
对 185 个开源项目进行综合分析,发现机器学习项目在持续集成方面存在独特挑战,如建立时间更长、测试覆盖率较低以及构建时间趋势增加的问题。研究通过定量和定性分析揭示了持续集成在机器学习和传统项目中的差异和讨论的主题。
- GIRT - 模型:自动生成问题报告模板
通过使用 GIRT-Model,研究人员开发了自动生成的 Issue Report Templates,能够帮助开发者更高效地管理问题,并提高开发者之间的对齐度。
- GitAgent:通过工具扩展促进 GitHub 中的自主代理
介绍了 GitAgent,一种能够从 GitHub 实现自主工具扩展的代理,通过四阶段的过程将仓库纳入工具集,并通过 GitHub 问题 / 拉取请求学习人类经验,实验评估结果表明 GitAgent 平均成功率为 69.4%。
- GitHub 上的开放数据:发掘人工智能潜力
本研究分析了 GitHub 平台上的开放数据格局及用户分享数据集的模式,并披露了 GitHub 是世界上最大的开放数据主机之一,研究还公开发布了三个数据集以支持分析。该平台的数据资源对于加速 AI 研究尤为重要。
- 数字技术审查的意外后果 —— 意大利 ChatGPT 禁令的证据
本文主要研究了 ChatGPT 聊天机器人禁令对于程序员效率的影响,通过编译来自欧洲国家 8000 多名职业 GitHub 用户的编码输出数据,作者发现 ChatGPT 禁令导致意大利开发者的代码生产力在禁令公布后的头两个工作日内下降了约 - PAGE:一种面向情感因果推断的基于位置感知的图模型
该研究提出了一种基于位置感知图的方法来处理对话中的因果关系,实现了与该领域最先进的模型相当的性能,并提供了源代码。
- MAST:多尺度音频频谱变换器
本文提出了一个多尺度音频谱图变换器(MAST),用于音频分类和自监督学习,在 LAPE 基准测试上,相较于 Audio Spectrogram Transformer(AST)和 SSAST,MAST 和 SS‐MAST 具有更高的性能,并 - 基于注意力机制的源代码仓库嵌入学习
论文介绍了 Topical 深度神经网络,利用 GitHub 源代码生成存储库级别嵌入,以实现存储库自动标记等任务。
- CommitBART:GitHub 提交专用的大型预训练模型
本论文介绍了一种基于 GitHub 中代码提交记录的预训练模型 CommitBART,利用三种不同的任务进行预训练,并融合了一种 “提交智能” 框架来理解和生成代码提交记录,最终实验结果表明该模型在代码预训练上取得了重大的突破。
- 机器学习系统变更分类法探究
本文研究了 1346 个机器学习研究代码库及其 67,369 个 fork 的贡献情况,发现只有 9% 的 fork 对代码库进行了修改,而大部分未被贡献回来的修改主要涉及领域特定的个性化定制和本地实验,并且涉及到了文档变更、功能变更和 B - 对基于代码训练的大型语言模型的评估
本文介绍了从 GitHub 公开可用的代码细调的 Codex 语言模型,并研究了其 Python 代码编写能力。在新的评估集 HumanEval 上,我们的模型可解决 28.8% 的问题,并发现重复采样模型是解决难题的有效策略。但我们也发现 - ICML利用时间知识图谱中的相对时间进行软件工程事件建模
该论文介绍了在 GitHub 上基于日常交互构建多关系时间知识图谱的方法,并在该数据集上进行了一系列相关问题的实验,结果表明现有的时间模型在外推和时间预测查询方面表现不佳,我们通过使用相对时间信息来扩展现有的时间模型,从而克服这些缺点并回答 - paper2repo: 学术论文的 GitHub 代码库推荐
本文介绍了一种名为 paper2repo 的创新性基于 GCN 的跨平台推荐系统,利用自动标记和机器学习方法在 GitHub 和 Microsoft Academic 上匹配相似的论文和 repo,并取得了比其他现有推荐方法更好的性能。
- 如何评估 GitHub 开源项目的维护水平,了解维护活动程度
通过数据驱动的方法和机器学习模型,本文研究了 GitHub 项目的维护活动水平,揭示了 16% 的项目在一年内未得到维护,并指出 Objective-C 项目具有较低的维护活动水平,软件工具则是维护活动最高的项目类型。这项研究为开发者选择开 - Java 项目中潜在的代码借用和许可证违规研究
研究了开源软件的许可文件问题,对 GitHub 上的流行 Java 项目进行了克隆代码的查找,并分析了可能存在的许可问题和代码借用。
- 神经网络蒸馏器:DNN 压缩研究的 Python 软件包
该论文介绍了神经网络压缩研究的开源 Python 软件包 Neural Network Distiller 的哲学、设计和功能集。该软件包旨在为工程师和研究人员提供 DNN 压缩算法实现、工具、教程和样本应用,并具有可扩展性的设计,可方便新 - HiGitClass: 基于关键词的 GitHub 资源库层次分类
本篇研究提出了 HiGitClass 架构,它是一个关键词驱动的层次分类框架,可以从结构化和非结构化的数据中自动对 GitHub 代码库进行分类,尤其在集成结构化和非结构化数据方面表现出色,解决了基于主题搜索的需求,对提供少量人力资源的信息 - 在 GitHub 上对 Wontfix 问题进行定性描述和自动识别
本研究对 GitHub 项目的大约 6000 个报告中的 Wontfix 问题进行了调查研究,统计了造成 Wontfix 决策的常见原因和影响其解决时间的潜在因素,利用机器学习方法成功地预测 Wontfix 问题,实现了高精度、高召回率和 - 基于跨项目和技术经验的 GitHub 代码审查者推荐
本文提出了一种考虑到开发者特定技术专业性的代码审查者推荐技术,该技术利用外部库经验等关联历史,可提供高达 85%-92% 的准确性,86% 的精度和 79%-81% 的召回率,为代码审查提供高效帮助。