PsyQA:中文心理健康辅导长文生成数据集
为了解决编程教育中的数据稀缺问题,本文提出了一个针对 Python 学习者的新的中文问答数据集,通过收集实际学生问题并根据不同维度进行分类,以提高在线编程教育的效果和质量,并为开发编程教学助手提供扎实的数据基础。同时,通过对各种处理和生成中文内容的大型语言模型进行全面评估,凸显了通用大型语言模型在计算机编程课程中作为智能教学助手的潜在局限性。
Jan, 2024
本研究介绍了 MentalQA,一个新颖的阿拉伯语数据集,提供问题和答案的对话式交互。该数据集为开发阿拉伯语文本挖掘工具提供了基础,以支持心理健康专业人员和寻求信息的个人。
May, 2024
通过大型语言模型,本研究设计了基于认知行为疗法的特定提示,生成了针对中国心理健康问答的 CBT QA 数据集,并利用该数据集对大型语言模型进行微调,从而产生了专为认知行为疗法技术设计的大规模语言模型 CBT-LLM。经验评估表明 CBT-LLM 在心理健康支持任务中能够产生结构化、专业和高度相关的回应,展示了其实用性和质量。
Mar, 2024
本研究释放了一个含有 2600 万问答对的医疗问答数据集,并通过检索和生成方面的基准测试了许多现有方法,结果表明,现有模型的表现远远低于预期,并且该数据集在预训练语言模型时代仍然具有挑战性。此外,本研究实验证明了所提出的数据集在许多方面的好处,即模型零 - shot 训练、用作检索 - 生成的外部知识和在持续训练中使用问答对作为预训练语料库来提高现有预训练语言模型的性能。我们相信,该数据集不仅将有助于医学研究,而且还将有助于患者和临床医生们。
May, 2023
通过引入 PCoQA 数据集,本研究旨在为会话式问答研究提供第一个波斯语会话式问答数据集,包含多达 9,026 个背景驱动的问题,涉及提问者、回答者和维基百科文档。该数据集对以往问答数据集提供了新的挑战,包括更多开放性非事实性答案、较长答案和更少的词汇重复。本文还介绍了多种基准模型的性能,包括基线模型和预训练模型,并使用预训练模型提升了性能。有关数据集和基准模型可在我们的 Github 页面上获取。
Dec, 2023
使用大型语言模型(LLMs)辅助心理咨询是一个重要但具有挑战性的任务。我们提出了 CPsyCoun,一个面向中文心理咨询的基于报告的多轮对话重构和评估框架,旨在弥补现有数据集在咨询知识方面的不足,以及自动评估心理咨询过程中的多轮对话。竞争实验结果表明了我们提出的框架在心理咨询中的有效性。我们开源数据集和模型供将来的研究使用。
May, 2024
使用生成型的大型语言模型,在中医问答领域表现令人不满意,本研究引入了一个专门为中医问答设计的对话模型 MedChatZH,该模型在中医经典著作上进行预训练,并结合医学指南数据进行精细调优,在真实的医学对话数据集上胜过了几个基线模型。我们在链接上发布了我们的模型、代码和数据集,以促进传统中医和大型语言模型领域的进一步研究。
Sep, 2023
本研究提供了首个针对医疗问题的自由形式多项选择 OpenQA 数据集 MedQA,涵盖三种语言,并通过实现规则和神经网络两种方法进行实验,最终发现即使是当前最好的方法在英语、繁体中文和简体中文问题上也只能实现 36.7%、42.0%和 70.1%的测试准确率,希望这个数据集能够为推动未来更强大的 NLP OpenQA 模型的发展提供平台。
Sep, 2020
介绍了 WebCPM,首个基于交互式 Web 搜索的中文长篇问答(LFQA)数据集,共收集 5,500 个高质量的问答对,开发了基于预训练语言模型微调的 LFQA 流水线,生成的答案在数据集和 DuReader 上能达到不亚于人类书写的水平。
May, 2023
提出了一种新的方法,自动生成用于 QA 模型的迁移学习的训练数据,该模型在电子健康记录的信息提取子任务中表现出色且能够有效处理少样本或零样本情况的问题。
Feb, 2024