Edu-ConvoKit:教育对话数据的开源库
ConvLab-2 是一款开源工具包,它可以帮助研究人员建立任务导向的对话系统,具备最先进的模型,进行端到端评估,并诊断系统的不足之处。
Feb, 2020
EduChat 是一个基于大规模语言模型(LLM)的教育领域聊天机器人系统,旨在支持个性化、公平、有爱心的智能教育,为教师、学生和家长提供支持。它通过在教育语料库上进行预训练来学习领域特定知识,并通过在设计的系统提示和指令上进行微调来刺激各种技能。目前,EduChat 作为一个开源项目在线上提供,其代码、数据和模型参数可在平台上获得。这项倡议旨在促进基于 LLMs 的智能教育的研究与应用。
Aug, 2023
教育资源理解对于在线学习平台至关重要,该研究旨在开发出一种统一、模块化、广泛应用的库(EduNLP),以实现有效且易于使用的自然语言处理工具,以促进人工智能教育相关研究和应用。
Jun, 2024
该论文介绍了一种用于各类难度级别的科学概念对话教学的新方法,并通过对视频转录的对话进行分析,展示了其中多样化的例子可以用于为特定目标受众生成感性合适和自然的回应。这是一个对话模型的有价值资源,可以用于训练和评估,涵盖了有机发生的对话。
Apr, 2024
KGConv 是一个大型的对话数据集,包含 71,000 个基于 Wikidata 事实的对话,平均每个对话包含 8.6 个问题和对应问题的多个变体。该数据集可用于知识驱动对话问题生成以及其他生成和分析任务。
Aug, 2023
ConvLab-3 是一个灵活的对话系统工具包,基于统一的面向任务对话(TOD)数据格式,旨在解决 TOD 数据集的多种格式和本体的障碍,可极大地降低模型适应新模型或数据集的成本。
Nov, 2022
ConvLab 是一个开源的多领域端到端对话系统平台,它使研究人员能够快速设置实验,并比较许多不同的方法,从传统的管道系统到端到端的神经模型,在共同环境中。ConvLab 提供了一组完全注释的数据集和相关的预训练参考模型。我们扩展了 MultiWOZ 数据集,使用用户对话行为注释来训练所有组件模型,并展示了 ConvLab 如何使得在多领域端到端对话设置中进行复杂实验变得简单而不费力。
Apr, 2019
开发了结合了 ChatGPT 功能和英语教科书系统材料的 Curriculum-Driven EduBot 聊天机器人框架,通过提取教科书相关主题并使用大型语言模型生成相关对话,进一步使用生成的对话数据对开源 LLM 进行微调,以创建与用户课程相匹配的聊天机器人,用户研究表明,我们的聊天机器人在引导基于课程的对话和适应用户英语水平方面优于 ChatGPT,将传统教科书方法与对话式 AI 相结合,提供学习者与课程相符合的互动工具,并提供用户定制的对话练习,从而促进有意义的学生 - 机器人对话,丰富课程教学框架下的整体学习体验。
Sep, 2023