Nov, 2023

大型语言模型助力:使用 ChatGPT 简化科学工作流程开发的复杂性

TL;DR科学工作流系统越来越受欢迎,可以表达和执行对大数据集的复杂数据分析流水线,因为它们提供了自动化并行化在大型计算集群上的可重复性、可靠性和可扩展性。然而,由于涉及许多黑盒工具和必要的底层基础架构,实现工作流变得困难。同时,用户支持工具很少,可用示例数量远低于传统编程语言。为了应对这些挑战,我们研究了大型语言模型(LLMs),特别是 ChatGPT,在科学工作流处理过程中对用户的支持效率。我们在两个科学领域进行了三项用户研究,评估了 ChatGPT 在理解、适应和扩展工作流方面的效果。我们的结果表明,LLMs 可以有效地解释工作流,但在交换组件或目的工作流扩展方面表现较差。我们对这些具有挑战性的情景中的局限性进行了界定,并提出了未来的研究方向。