SoTaNa: 开源软件开发助手

Aug, 2023

SoTaNa: The Open-Source Software Development Assistant

Ensheng Shi, Fengji Zhang, Yanlin Wang, Bei Chen, Lun Du...

TL;DRSoTaNa 是一个开源软件开发助手，使用 ChatGPT 来生成基于指令的高质量数据并利用参数高效的微调方法增强开源基础模型 LLaMA，在回答 Stack Overflow 问题、代码摘要生成和生成数据量对模型性能的影响方面展示了其能力。

Abstract

Software development plays a crucial role in driving innovation and efficiency across modern societies. To meet the demands of this dynamic field, there is a growing need for an effective software development assistant. However, existing large language models represented by

software development assistant chatgpt sotana code summarization stack overflow questions

发现论文，激发创造

通过 ChatGPT 的自动代码摘要：我们还有多远？

本文重点评估了最流行的大型语言模型 ChatGPT 在自动代码注释中的性能，并将其与其他最先进的代码摘要模型进行比较，结果表明在 BLEU 和 ROUGE-L 方面，ChatGPT 的代码摘要性能显着低于其他三个模型。

May, 2023

开放域会话人工智能技术现状：综述

该论文调查了现有的开放领域对话人工智能模型，并提出目前存在的主要挑战，同时提供性别统计数据以引发相关伦理讨论。研究认为，虽然最新的技术有了很大进步，但仍需解决许多问题，并且女性模型相对男性模型更常见，混合模型比任何单一架构更具优势。

May, 2022

ChaTA：运用开源 LLMs 构建智能问答辅导助手

为应对可扩展且智能的问答挑战，我们引入了一种创新解决方案，利用开源的大型语言模型（LLMs）来确保数据隐私。我们在一个入门计算机科学课程的 Piazza 数据集上进行了实验，并对一个小的子集进行了人工评估和自动 LLM 评估。我们初步发现通过多种建模技术能够将答案的质量提升 33％，而 RAG 是一个有影响力的改进。这项工作为开发适用于在线问答平台的智能 QA 助手 ChaTA 打下了基础。

Nov, 2023

ChatGPT 在初级编程课程中是否能担任助教的角色？

研究论文探讨了在一个初级编程课程中使用 ChatGPT 作为虚拟助教的潜力，并通过比较其与人类助教在一些助教功能上的表现来评估 ChatGPT 的能力。论文结论中讨论了将 ChatGPT 纳入计算机教育中对自动分级、个性化学习和教学支持的影响。

Dec, 2023

OpenAssistant Conversations -- 大型语言模型对齐的民主化

研究大规模语言模型的发布与使用，利用调整技术进行优化以改善使用性，此文介绍 OpenAssistant Conversations 数据库的发布，使用该人类生成的、人类注释的数据集进行训练后得到了全新的软件 OpenAssistant。相对于 ChatGPT，OpenAssistant 的答复被用户更青睐，其发布的代码和数据完全遵循宽松许可证，可供研究者使用。

Apr, 2023

ChatGPT: 最终的编程助手吗？—— 它有多远？

我们通过实证分析了 ChatGPT 在无人辅助编程助手方面的潜力，并强调了其相对程序生成、程序修复、代码摘要方面的表现，并对其在常见编程问题上的表现进行了评估，这证明 ChatGPT 有效地处理典型的编程挑战，但我们也发现，综合的描述可能会限制 ChatGPT 的关注点并阻碍其利用其广泛的知识进行问题解决。

Apr, 2023

CodeS：构建面向文本到 SQL 的开源语言模型

本研究介绍一种名为 CodeS 的开源语言模型，旨在解决 Text-to-SQL 任务中现有限制，并通过增量预训练、模式构建和双向数据增强等方法提升了 CodeS 在 SQL 生成能力上的表现，并在多个数据集上取得了新的最先进准确性和鲁棒性。

Feb, 2024

面向高等教育的跨平台和课程导向的智能助手

通过提供弹性的教育模式建议，基于 GPT-3 的智能教育辅助框架被研发，能够自动生成课程助手，可以回答与教学相关的问题，降低教师和助教的工作量同时提高学生获得课程相关信息的机会。

Feb, 2023

HaT5: 使用文本转换转换器进行仇恨语言识别

本研究使用 T5 架构及自回归模型对包含 5 个不同任务的 2 个数据集进行性能比较与错误分析，提出了一种新的数据增强方法以及训练方法并通过解释性人工智能算法提高了预测准确率。

Feb, 2022

ChatGPT：关于其在普适软件工程任务中效用的研究

本研究使用 ChatGPT 这一语言模型探讨了如何利用其在软件工程中辅助完成常见任务，研究结果显示 ChatGPT 对许多任务均有不错的表现，但仍存在一些任务不适用。

May, 2023