通过深度对齐聚类发现新意图
本文介绍对话意图归纳任务,并提出一个新颖的深度多视角聚类方法来解决该问题。经过实验证明,AV-KMEANS可以比现有的无监督表示学习方法和标准的多视角聚类方法更好地导出对话意图簇。
Aug, 2019
本文提出了一种基于深度学习的约束自适应聚类方法CDAC+,可以自然地将成对约束作为先验知识来指导聚类过程,并通过高置信度的分配进行聚类细化,消除对聚类数的敏感性,实现了在三个基准数据集上的显著性能提升。
Nov, 2019
本文提出了意图发现框架,通过自动聚类类似用户话语并手动注释,再通过对未被聚类映射的话语标记意图标签和标记传播,从原始对话中生成意图训练数据,以有效地解决在聊天机器人开发过程中遇到的用户话语分类问题,并验证了该框架的有效性。
May, 2020
展示了一个基于 BERT 模型的 Intent Bulk Labeling 系统, 通过使用先进的聚类和可视化标注方法,与数据增强技术相结合,提高了 SDS 模型的意图和分类准确度达到超过 10% 的效果。同时,该系统还可从聚类模型提取话语嵌入并以交互方式进行批量标记,减少了数据标注的时间和精力消耗。
Apr, 2021
DCSC是一种半监督的文本聚类方法,可对话系统中的文本样本进行聚类,通过两阶段训练过程利用标记样本,取得最佳聚类性能,从而在文本归类方面取得了最佳性能。
Jan, 2022
本研究提出一种新的意图发现方法,通过多任务预训练和对比损失优化聚类来学习语义表述以扩展对话系统中支持的意图类别。实验结果表明,该方法在半监督和无监督场景下均优于现有方法。
May, 2022
本研究提出了一种无监督的自动化pipeline,基于问答模型和聚类方法,能够从真实的对话数据中抽取意图并建立意图分组分类体系,验证结果表明该方法能够解决自然语言理解中的意图识别问题,实现了超过85%的区分准确度。
Aug, 2022
本文探讨了无监督方法来克服任务导向对话结构设计的基本挑战:为每个对话轮分配意图标签(意图聚类)和生成一组基于意图聚类方法的意图(意图归纳),并且通过比较不同的 clustering 算法和嵌入方法,表明对于意图归纳任务,应当仔细考虑句子嵌入和聚类方法的组合选择,同时 MiniLM 和聚合聚类结构在意图归纳任务中显示出显著的性能提升。
Dec, 2022
提出了一种名为USNID的新框架,它通过三种主要技术实现了无监督半监督的新意图发现,包括利用无监督或半监督数据挖掘浅层语义相似性关系,设计一个质心引导的聚类机制以提供高质量的自我监督目标,以及通过最优化聚类级别和实例级别目标发现细粒度意图集群,该框架在多个意图基准数据集上表现出色,并在无监督和半监督新意图的发现方面取得了最新的最高成果,证明了在不同的聚类数下其鲁棒性表现良好
Apr, 2023