本研究对基于大型语言模型的对话 UI 进行了研究,目标是实现上下文感知的工具,该工具可以自动利用开发人员的编程上下文来回答问题。我们为用户提供了一个 IDE 插件,允许用户使用高级请求查询后端(例如 OpenAI 的 GPT-3.5 和 GPT-4),我们进行了 32 名参与者的探索性用户研究,研究确认这种方法比 Web 搜索更有效地帮助理解代码,但效果的差异因参与者的经验水平而异。
Jul, 2023
该研究论文介绍了一种新的搜索界面,支持对单语或多语言文档集合进行自动生成查询,并通过用户反馈来优化查询,从而解决用户在查询表达方面的困难。
Nov, 2023
CarExpert 通过借助大型语言模型(LLMs)在不针对特定任务和数据进行微调的情况下,控制输入,为抽取和生成回答组件提供特定领域的文档,并控制输出,以确保生成自然、安全且针对汽车领域的答案,优于最先进的 LLMs。
Oct, 2023
本文介绍了一种使用 ExpertPrompting 技术的方法,通过 In-Context Learning 实现了定制化的指令,并将其用于训练基于 GPT-3.5 的 ExpertLLaMA 模型,实现了与 ChatGPT 相近的对话效果。
May, 2023
本文探讨了在编程教育中使用大型语言模型(LLMs)的机会和威胁,研究表明 LLMs 有助于识别学生代码中的问题,但不可靠,需要在未来的研究中进一步挖掘。
Jun, 2023
提出了针对电子商务撰写任务的统一和定制的 LLaMA-E 语言模型,包括广告生成、查询增强的产品标题重写、产品分类、购买意向推测和常见问答等任务,并将 GPT-3.5 作为教师模型,通过扩展种子指令形成 LLaMA-E 模型的训练集,在定量和定性评估中取得了最先进的结果,并在零样本场景中展现出优势。
Aug, 2023
本研究基于最新的想法,将大型语言模型视为能够访问多个包含有关组织,机构和公司的最新和精确信息的代理。研究通过生成一个原型代理来演示了该方法的有效性,该代理可以从 ClimateWatch 检索排放数据并利用 Google 搜索。通过将这些资源与 LLMs 相结合,我们的方法克服了不准确语言的局限性,在气候变化这一关键领域提供了更可靠和准确的信息。这项工作为 LLMs 的未来发展以及它们在需要精确信息的领域中的应用开辟了道路。
Mar, 2023
本文探讨了使用大型语言模型进行编程的相似之处和不同之处,认为 LLM-assisted 编程应该被视为一种具有自己独特属性和挑战的新编程方式,并讨论了在将大型语言模型应用于非专业用户编程时可能出现的问题和研究挑战。
Aug, 2022
通过使用嵌入式算法来扩展预训练语言模型的能力,作者提出了一种证据支持的问答方法来展示这种方法的优势,相比于传统的 fine-tuning 方法,该方法获得了 6.4%的改进。
本研究提出了一种 LLm-Augmenter 系统,它通过使用存储在特定任务数据库中的外部知识和迭代地根据效用函数生成的反馈来改善 LLM 的提示,从而使其生成基于外部知识的响应,实现了应用到任务导向对话和问题回答的实际场景中,显著减少 ChatGPT 模型的幻觉。
Feb, 2023