能效软件背景下的实证软件工程教学十年

Jul, 2024

能效软件背景下的实证软件工程教学十年

Ten Years of Teaching Empirical Software Engineering in the context of Energy-efficient Software

Ivano Malavolta, Vincenzo Stoico, Patricia Lago

TL;DR本文介绍了在荷兰阿姆斯特丹自由大学举办的绿色实验室课程的经验，该课程在计算机科学硕士专业的软件工程和绿色信息技术专业方向进行。课程以研究为导向，学生在2个月的时间里通过自己的实验来实现科学目标，全过程涵盖了实证软件工程的基本原理，学生在使用开源工具的过程中形成合作学习社区。

Abstract

In this chapter we share our experience in running ten editions of the green lab course at the Vrije Universiteit Amsterdam, the Netherlands. The course is given in the Software Engineering and Green IT track of the Computer Science Master program of the VU. The course takes place ever

发现论文，激发创造

能源使用报告：算法问责的一部分的环境意识

应对算法的碳足迹是电脑科学家在环境可持续性方面起到积极和诚实作用的关键，本研究通过易于使用的Python程序包实现了从能源使用到二氧化碳排放的转换，并将计算结果与人类可理解的基准（如汽车行驶英里）联系起来，并提出将这些自动化能源使用报告作为算法问责实践的一部分。与电网中的能量混合物进行比较，展示其用于机器学习背景下的模型选择。

Nov, 2019

数据中心绿色人工智能：一项探索性实证研究

本文旨在通过实证研究来评估数据集修改对人工智能能源效率的影响。实验结果表明，可以通过仅对数据集进行修改（数据点数和特征数），显著降低（高达92.16%）能耗并几乎不降低准确性。此外，本文还证明了通过更改算法能够实现节能（高达两个数量级）。研究成果呼吁进一步研究采用数据为中心技术，进一步推动绿色人工智能的普及。

Apr, 2022

源代码语言模型共享与能源利用的探索文献研究

本研究旨在调查与分析语言模型设计用于软件工程任务的研究是否共享代码及模型，以及针对模型训练所用的能源的透明度，从可持续的角度收集有用的信息。我们发现，当前研究中存在信息和工件共享的不足，约40％的调查论文没有共享代码或训练过的工件，我们建议共享源代码和训练过的工件，以实现可持续的可重复性，同时还应该共享有关训练所需时间和硬件配置的全面信息，以确保模型的碳足迹透明度。

Jul, 2023

GPT-4能否复制实证软件工程研究？

本研究旨在考察大型语言模型（如GPT-4）在新数据上执行经验软件工程研究的复制能力，发现GPT-4能够提供正确的假设，但难以生成反映软件工程数据的常规知识的假设，同时在生成的代码中存在实现层面错误，显示出对软件工程知识的欠缺。这些发现对于利用LLMs进行软件工程研究以及软件团队中的数据科学家具有重要意义。

Oct, 2023

为平衡讲师和研究者激励而开展的持续改进的自适应实验的机遇

利用机器学习算法进行自适应试验可以在教学改进中提供更好的支持，此方法可以通过随机实验比较传统和自适应试验来探索如何在研究和实践中进行持续改进。

Oct, 2023

基于机器学习的系统的绿色建筑策略综合

通过分析51篇与Green AI相关的同行评审出版物和三位专家的焦点小组讨论，我们提供了30种ML-enabled系统的绿色架构策略的目录，旨在填补这一领域缺口，并且为进一步探索软件工程角度的Green AI和设计可持续的ML-enabled系统提供初始参考指南，这些策略有潜力在能源和碳足迹方面显著减少ML-enabled系统的社会影响。

Dec, 2023

可持续学习编程：基于LLM的绿色代码生成的实证研究

信息技术的增长导致数据中心耗能和碳排放占比的显著增加。为了应对软件开发的环境影响，绿色编码和使用人工智能模型可提高能源效率已成为研究的热点。本研究以可持续性指标为基础，对自动生成代码的可持续性意识进行了评估，并比较了人工生成代码与三种人工智能语言模型生成代码在易难问题陈述下的性能和可持续性能力。结果揭示了当前人工智能模型在可持续软件开发方面的贡献能力。

Mar, 2024

代码Llama生成源代码的能源效率的控制实验

我们通过实证研究评估了Code Llama相对于人工编写的源代码的能源效率，结果表明Code Llama生成的代码的能源效率受选择的编程语言和具体的代码问题的影响，但人工实现总体上更具能源效率，而生成的JavaScript代码优于人工实现。因此，在将生成的代码集成到正在开发的软件系统之前，当务之急是软件开发人员评估生成的代码的能源效率。

May, 2024

ML 训练与推断中的能耗实证研究

本研究旨在通过研究绿色机器学习，考察不同模型架构和超参数在训练和推理阶段中的能效实践，以提供可持续的机器学习操作的实用指南，强调降低能耗和碳足迹同时保持性能。

Jun, 2024

创新即时代的融合：软件工程与绿色人工智能的交叉

机器学习和基础模型的最新进展正在改变现有软件工程过程的前沿，本文考虑了采用环境友好实践创建AI软件系统的影响，并对使用基础模型进行软件开发的环境影响进行了讨论。

Jun, 2024