通过深度对齐聚类发现新意图

Dec, 2020

Discovering New Intents with Deep Aligned Clustering

Hanlei Zhang, Hua Xu, Ting-En Lin, Rui Lv

TL;DR该论文提出了一种基于少量先前标记样本预训练模型来发现新意图、使用 k-均值产生伪标签、并提出了一种对齐策略来解决聚类分配过程中标签不一致问题的方法，最终在众多测试中表现更为鲁棒且优于现有方法。

Abstract

Discovering new intents is a crucial task in a dialogue system. Most existing methods are limited in transferring the prior knowledge from known intents to new intents. These methods also have difficulties in providing high-quality supervised signals to learn clustering-friendly features for grouping unlabeled intents. In this work, we propose an effective m

发现论文，激发创造

使用深度多视角聚类进行对话意图归纳

本文介绍对话意图归纳任务，并提出一个新颖的深度多视角聚类方法来解决该问题。经过实验证明，AV-KMEANS可以比现有的无监督表示学习方法和标准的多视角聚类方法更好地导出对话意图簇。

Aug, 2019

通过受限深度自适应聚类和聚类细化发现新意图

本文提出了一种基于深度学习的约束自适应聚类方法CDAC+，可以自然地将成对约束作为先验知识来指导聚类过程，并通过高置信度的分配进行聚类细化，消除对聚类数的敏感性，实现了在三个基准数据集上的显著性能提升。

Nov, 2019

从过去的对话中挖掘意图信息以供会话代理使用

本文提出了意图发现框架，通过自动聚类类似用户话语并手动注释，再通过对未被聚类映射的话语标记意图标签和标记传播，从原始对话中生成意图训练数据，以有效地解决在聊天机器人开发过程中遇到的用户话语分类问题，并验证了该框架的有效性。

May, 2020

半监督交互式意图标注

展示了一个基于 BERT 模型的 Intent Bulk Labeling 系统, 通过使用先进的聚类和可视化标注方法，与数据增强技术相结合，提高了 SDS 模型的意图和分类准确度达到超过 10% 的效果。同时，该系统还可从聚类模型提取话语嵌入并以交互方式进行批量标记，减少了数据标注的时间和精力消耗。

Apr, 2021

利用对比学习的半监督聚类发现新意图

DCSC是一种半监督的文本聚类方法，可对话系统中的文本样本进行聚类，通过两阶段训练过程利用标记样本，取得最佳聚类性能，从而在文本归类方面取得了最佳性能。

Jan, 2022

使用预训练和对比学习进行新意图发现

本研究提出一种新的意图发现方法，通过多任务预训练和对比损失优化聚类来学习语义表述以扩展对话系统中支持的意图类别。实验结果表明，该方法在半监督和无监督场景下均优于现有方法。

May, 2022

利用可提取问答变换器构建实际谈话语料库的意图模式

本研究提出了一种无监督的自动化pipeline，基于问答模型和聚类方法，能够从真实的对话数据中抽取意图并建立意图分组分类体系，验证结果表明该方法能够解决自然语言理解中的意图识别问题，实现了超过85%的区分准确度。

Aug, 2022

针对任务导向对话的意图归纳相关话语嵌入和聚类方法分析

本文探讨了无监督方法来克服任务导向对话结构设计的基本挑战：为每个对话轮分配意图标签（意图聚类）和生成一组基于意图聚类方法的意图（意图归纳），并且通过比较不同的 clustering 算法和嵌入方法，表明对于意图归纳任务，应当仔细考虑句子嵌入和聚类方法的组合选择，同时 MiniLM 和聚合聚类结构在意图归纳任务中显示出显著的性能提升。

Dec, 2022

USNID：面向无监督和半监督的新意图发现框架

提出了一种名为USNID的新框架，它通过三种主要技术实现了无监督半监督的新意图发现，包括利用无监督或半监督数据挖掘浅层语义相似性关系，设计一个质心引导的聚类机制以提供高质量的自我监督目标，以及通过最优化聚类级别和实例级别目标发现细粒度意图集群，该框架在多个意图基准数据集上表现出色，并在无监督和半监督新意图的发现方面取得了最新的最高成果，证明了在不同的聚类数下其鲁棒性表现良好

Apr, 2023

IDAS: 使用抽象摘要发现意图

通过使用抽象摘要信息对话句子聚类，以发现隐含意图。本文提出了一种IDAS方法，利用大型语言模型来生成摘要标签，无监督任务中性能最先进。

May, 2023