能效软件背景下的实证软件工程教学十年
应对算法的碳足迹是电脑科学家在环境可持续性方面起到积极和诚实作用的关键,本研究通过易于使用的Python程序包实现了从能源使用到二氧化碳排放的转换,并将计算结果与人类可理解的基准(如汽车行驶英里)联系起来,并提出将这些自动化能源使用报告作为算法问责实践的一部分。与电网中的能量混合物进行比较,展示其用于机器学习背景下的模型选择。
Nov, 2019
本文旨在通过实证研究来评估数据集修改对人工智能能源效率的影响。实验结果表明,可以通过仅对数据集进行修改(数据点数和特征数),显著降低(高达92.16%)能耗并几乎不降低准确性。此外,本文还证明了通过更改算法能够实现节能(高达两个数量级)。研究成果呼吁进一步研究采用数据为中心技术,进一步推动绿色人工智能的普及。
Apr, 2022
本研究旨在调查与分析语言模型设计用于软件工程任务的研究是否共享代码及模型,以及针对模型训练所用的能源的透明度,从可持续的角度收集有用的信息。我们发现,当前研究中存在信息和工件共享的不足,约40%的调查论文没有共享代码或训练过的工件,我们建议共享源代码和训练过的工件,以实现可持续的可重复性,同时还应该共享有关训练所需时间和硬件配置的全面信息,以确保模型的碳足迹透明度。
Jul, 2023
本研究旨在考察大型语言模型(如GPT-4)在新数据上执行经验软件工程研究的复制能力,发现GPT-4能够提供正确的假设,但难以生成反映软件工程数据的常规知识的假设,同时在生成的代码中存在实现层面错误,显示出对软件工程知识的欠缺。这些发现对于利用LLMs进行软件工程研究以及软件团队中的数据科学家具有重要意义。
Oct, 2023
利用机器学习算法进行自适应试验可以在教学改进中提供更好的支持,此方法可以通过随机实验比较传统和自适应试验来探索如何在研究和实践中进行持续改进。
Oct, 2023
通过分析51篇与Green AI相关的同行评审出版物和三位专家的焦点小组讨论,我们提供了30种ML-enabled系统的绿色架构策略的目录,旨在填补这一领域缺口,并且为进一步探索软件工程角度的Green AI和设计可持续的ML-enabled系统提供初始参考指南,这些策略有潜力在能源和碳足迹方面显著减少ML-enabled系统的社会影响。
Dec, 2023
信息技术的增长导致数据中心耗能和碳排放占比的显著增加。为了应对软件开发的环境影响,绿色编码和使用人工智能模型可提高能源效率已成为研究的热点。本研究以可持续性指标为基础,对自动生成代码的可持续性意识进行了评估,并比较了人工生成代码与三种人工智能语言模型生成代码在易难问题陈述下的性能和可持续性能力。结果揭示了当前人工智能模型在可持续软件开发方面的贡献能力。
Mar, 2024
我们通过实证研究评估了Code Llama相对于人工编写的源代码的能源效率,结果表明Code Llama生成的代码的能源效率受选择的编程语言和具体的代码问题的影响,但人工实现总体上更具能源效率,而生成的JavaScript代码优于人工实现。因此,在将生成的代码集成到正在开发的软件系统之前,当务之急是软件开发人员评估生成的代码的能源效率。
May, 2024
本研究旨在通过研究绿色机器学习,考察不同模型架构和超参数在训练和推理阶段中的能效实践,以提供可持续的机器学习操作的实用指南,强调降低能耗和碳足迹同时保持性能。
Jun, 2024
机器学习和基础模型的最新进展正在改变现有软件工程过程的前沿,本文考虑了采用环境友好实践创建AI软件系统的影响,并对使用基础模型进行软件开发的环境影响进行了讨论。
Jun, 2024