Jul, 2023

低资源和领域特定编程语言的编码潜力研究

TL;DR本文研究了使用大型语言模型(LLM)在低资源和领域特定编程语言中进行编码的可行性,该类编程语言通常缺乏有效的 LLM 处理所需的数据量。本研究侧重于开源软件 gretl 的计量脚本语言 hansl,并采用基于 GPT-3.5 的专有 LLM。我们的研究发现,LLM 在编写、理解、改进和文档化 gretl 代码方面是一个有用的工具,包括为函数生成描述性文档字符串和为抽象和文档不完整的计量代码提供精确解释。尽管 LLM 展示了 docstring 到代码转换能力的潜力,我们也确定了一些限制,如无法改进某些代码部分和编写准确的单元测试。本研究是利用 LLM 的能力来促进低资源编程语言的软件开发并最终降低其采用门槛的一步。