ConvoKit:对话分析工具包
介绍了 Edu-ConvoKit,这是一个开源库,用于处理教育中的对话数据的预处理、注释和分析。资源匮乏使得对教育对话数据进行分析的研究具有挑战性,因此难以获取。通过 Edu-ConvoKit,我们解决了这些问题。
Feb, 2024
ConvLab-2 是一款开源工具包,它可以帮助研究人员建立任务导向的对话系统,具备最先进的模型,进行端到端评估,并诊断系统的不足之处。
Feb, 2020
该论文提出了一种由系统 Chatin 实现的对话式方法,旨在为直观的数据探索体验提供驱动。Chatin 是一种先进的工具,通过解锁数据科学解决方案的全部潜力,赋予来自各个学科的非技术用户探索数据并从中提取知识的能力。
Nov, 2023
KGConv 是一个大型的对话数据集,包含 71,000 个基于 Wikidata 事实的对话,平均每个对话包含 8.6 个问题和对应问题的多个变体。该数据集可用于知识驱动对话问题生成以及其他生成和分析任务。
Aug, 2023
本文提出了一个包括 Wikipedia 贡献者间全部对话记录的语料库,通过记录评论和回复等中间状态,支持对大规模在线协作过程及挑战的新型研究,其中两个案例研究揭示了人的谈话行为如何与讨论场所相关,以及社区管理对有害行为的调控高于先前估计水平,并且语言无关性强,能够提取高质量的中英文对话数据。
Oct, 2018
本文介绍了 Conversation Search (ConvSearch) 的方法,重点关注人机交互特征和操作模块,同时将其应用于医疗保健领域,帮助信息检索过程并探讨挑战和问题。
Nov, 2022
ConvLab-3 是一个灵活的对话系统工具包,基于统一的面向任务对话(TOD)数据格式,旨在解决 TOD 数据集的多种格式和本体的障碍,可极大地降低模型适应新模型或数据集的成本。
Nov, 2022
该研究介绍了 QAConv,这是一个新的基于对话的问题回答(QA)数据集,通过长、复杂、异步和涉及强领域知识的信息型对话提供了一个新的训练和评估测试平台来促进 QA 在对话研究中的应用。
May, 2021
提出了一种名为 CRSLab 的开源工具包,为统一和扩展框架提供高度解耦合的模块以开发对话型推荐系统,并收集了 6 个常用的 CRS 数据集和实现 18 个模型,包括最近的技术,例如图神经网络和预训练模型。工具包提供了一系列自动评估协议和人机交互界面,以测试和比较不同的 CRS 方法
Jan, 2021
该论文介绍了一种用于各类难度级别的科学概念对话教学的新方法,并通过对视频转录的对话进行分析,展示了其中多样化的例子可以用于为特定目标受众生成感性合适和自然的回应。这是一个对话模型的有价值资源,可以用于训练和评估,涵盖了有机发生的对话。
Apr, 2024