大型语言模型的概念模型解释器
本研究对基于大型语言模型的对话 UI 进行了研究,目标是实现上下文感知的工具,该工具可以自动利用开发人员的编程上下文来回答问题。我们为用户提供了一个 IDE 插件,允许用户使用高级请求查询后端(例如 OpenAI 的 GPT-3.5 和 GPT-4),我们进行了 32 名参与者的探索性用户研究,研究确认这种方法比 Web 搜索更有效地帮助理解代码,但效果的差异因参与者的经验水平而异。
Jul, 2023
通过对 24 名职业软件工程师使用 ChatGPT 一周期间的对话和整体体验进行定性分析,发现他们更多地使用 ChatGPT 获取解决任务的指导或对抽象主题的学习,并提出了一个理论框架,指导今后关于职业软件工程师使用 LLM 的学术讨论和设计未来经验性研究。
Apr, 2024
ChatGPT 能够从自然语言需求中生成 UML 序列图,但生成的模型在完整性和正确性方面存在挑战,尤其在需求不明确和不一致的情况下。此研究对要求工程领域中的大型语言模型的实际应用和有效的模型生成提示策略具有重要影响。
Apr, 2024
本文介绍了如何利用大型语言模型 (LLMs) 和尤其是 ChatGPT 进行编程、源代码分析和代码生成,研究了 LLMs 和 ChatGPT 在代码创建、代码文档化、漏洞检测、重构等多个领域中的应用,并指出它们在编程社区中的使用有望得到进一步推广。
Jun, 2023
研究 ChatGPT 3.5 模型在编写代码方面的能力,评估其在 10 种编程语言和 4 个软件领域中生成代码片段的熟练程度,并发现了模型的主要意外行为和限制,旨在寻找发展的潜在领域,并检查自动生成代码对编程语言和技术行业发展的影响。
Aug, 2023
通过 Graphologue,我们发现利用图形化图表展示 LLMs 的信息能方便人们的信息处理与提问,构建了一种基于 LLMs 的交互式系统,使得信息的探索,组织和理解更加方便。
May, 2023
提出 LLM4PLC 的用户引导迭代流程,通过用户反馈和外部验证工具来改善大型语言模型(LLM)生成的代码的可验证性,提高成功生成的比例并提高代码质量。
Jan, 2024
利用 ChatGPT 作为注释器,我们在预训练语言模型中发现潜在概念,并采用 GPT 注释进行注释。我们的发现表明,与人类注释概念相比,ChatGPT 产生了准确且语义更丰富的注释。此外,我们展示了 GPT-based 注释如何增强解释分析方法,其中我们展示了两个分析框架:probing framework 和 neuron interpretation。为了促进进一步的探索和实验,我们提供了一个包含 39,000 个注释潜在概念的 ConceptNet 数据集。
May, 2023
使用大型语言模型与符号规划器和基于代码执行的系统组成的模块化可解释的对话系统,在处理任务导向对话中解决了大型语言模型难于引导到任务目标和处理新颖基础的问题,并在具有抽象散点图的协作参考解决任务中显著优于之前的最新技术,包括在最具挑战性的情境中将人工评估的任务成功率从 56% 提高到 69%。
Oct, 2023
本文描述了一个支持扩展多模态交互的系统,通过使用大型语言模型 (LLMs) 将用户的英语语句映射到领域特定的代码,我们探索了 LLMs 在上下文敏感性方面捕捉演算发言者意图的程度。
Oct, 2023