SoTaNa: 开源软件开发助手
本文重点评估了最流行的大型语言模型 ChatGPT 在自动代码注释中的性能,并将其与其他最先进的代码摘要模型进行比较,结果表明在 BLEU 和 ROUGE-L 方面,ChatGPT 的代码摘要性能显着低于其他三个模型。
May, 2023
该论文调查了现有的开放领域对话人工智能模型,并提出目前存在的主要挑战,同时提供性别统计数据以引发相关伦理讨论。研究认为,虽然最新的技术有了很大进步,但仍需解决许多问题,并且女性模型相对男性模型更常见,混合模型比任何单一架构更具优势。
May, 2022
为应对可扩展且智能的问答挑战,我们引入了一种创新解决方案,利用开源的大型语言模型(LLMs)来确保数据隐私。我们在一个入门计算机科学课程的 Piazza 数据集上进行了实验,并对一个小的子集进行了人工评估和自动 LLM 评估。我们初步发现通过多种建模技术能够将答案的质量提升 33%,而 RAG 是一个有影响力的改进。这项工作为开发适用于在线问答平台的智能 QA 助手 ChaTA 打下了基础。
Nov, 2023
研究论文探讨了在一个初级编程课程中使用 ChatGPT 作为虚拟助教的潜力,并通过比较其与人类助教在一些助教功能上的表现来评估 ChatGPT 的能力。论文结论中讨论了将 ChatGPT 纳入计算机教育中对自动分级、个性化学习和教学支持的影响。
Dec, 2023
研究大规模语言模型的发布与使用,利用调整技术进行优化以改善使用性,此文介绍 OpenAssistant Conversations 数据库的发布,使用该人类生成的、人类注释的数据集进行训练后得到了全新的软件 OpenAssistant。相对于 ChatGPT,OpenAssistant 的答复被用户更青睐,其发布的代码和数据完全遵循宽松许可证,可供研究者使用。
Apr, 2023
我们通过实证分析了 ChatGPT 在无人辅助编程助手方面的潜力,并强调了其相对程序生成、程序修复、代码摘要方面的表现,并对其在常见编程问题上的表现进行了评估,这证明 ChatGPT 有效地处理典型的编程挑战,但我们也发现,综合的描述可能会限制 ChatGPT 的关注点并阻碍其利用其广泛的知识进行问题解决。
Apr, 2023
本研究介绍一种名为 CodeS 的开源语言模型,旨在解决 Text-to-SQL 任务中现有限制,并通过增量预训练、模式构建和双向数据增强等方法提升了 CodeS 在 SQL 生成能力上的表现,并在多个数据集上取得了新的最先进准确性和鲁棒性。
Feb, 2024
通过提供弹性的教育模式建议,基于 GPT-3 的智能教育辅助框架被研发,能够自动生成课程助手,可以回答与教学相关的问题,降低教师和助教的工作量同时提高学生获得课程相关信息的机会。
Feb, 2023
本研究使用 T5 架构及自回归模型对包含 5 个不同任务的 2 个数据集进行性能比较与错误分析,提出了一种新的数据增强方法以及训练方法并通过解释性人工智能算法提高了预测准确率。
Feb, 2022
本研究使用 ChatGPT 这一语言模型探讨了如何利用其在软件工程中辅助完成常见任务,研究结果显示 ChatGPT 对许多任务均有不错的表现,但仍存在一些任务不适用。
May, 2023