- ACL走向真实场景:不平衡的新意图发现
通过创建 ImbaNID-Bench 数据集,并提出了 ImbaNID 模型,本论文在协助探索和分类极度不平衡以及长尾分布中的用户意图方面表现出优越性,成为一种有潜力的基准模型。
- RoNID: 生成可靠标签和聚类友好表示的新意图发现
通过 EM-style 方法,我们提出了一个 Robust New Intent Discovery(RoNID)框架,该框架致力于解决当前方法中存在的关于伪标签不准确和表示学习差的问题,并通过可靠的伪标签生成模块和友好的聚类表示学习模块构 - EMNLP大型语言模型应用于开放领域意图发现和识别的评估:ChatGPT
ChatGPT 对 OOD 意图探索和广义意图探索进行了全面评估,并概述了 ChatGPT 的优势和劣势。ChatGPT 在零样本设置下展现了一致的优势,但与微调模型相比仍处于劣势。通过一系列分析实验,我们总结和讨论了 LLM 面临的挑战, - EMNLP持续化的通用意图发现:迈向动态和开放式意图识别
通过原型引导的学习与重放和蒸馏方法,我们提出了一种连续的广义意图发现任务,旨在不断自动地从动态 OOD 数据流中发现 OOD 意图,并几乎不需要先前的数据将它们逐步添加到分类器中,从而朝着开放世界的动态意图识别迈进。
- ACLIDAS: 使用抽象摘要发现意图
通过使用抽象摘要信息对话句子聚类,以发现隐含意图。本文提出了一种 IDAS 方法,利用大型语言模型来生成摘要标签,无监督任务中性能最先进。
- ACL为广义目的发现解耦伪标签消歧和表示学习
提出了一种解耦伪标签消除和表示学习的原型学习框架 (DPL),并采用基于原型的标签消歧方法(PLD)和基于对比的原型表示学习(PCL)来获得鲁棒性更强的意图发现算法,实验证明方法在三个基准数据集上具有有效性。
- ACL超越研究数据集:工业场景下的新意图发现
本文提出了一种用于大型电子商务平台的意图发现流程改进方法,该方法利用了领域内数据的自我监督和弱监督预训练语言模型,以及利用现实生活数据的对话结构进行微调的最佳方法,并使用所有这些方法结合使用,使真实生活数据的使用比仅使用问题数据的 CDAC - USNID:面向无监督和半监督的新意图发现框架
提出了一种名为 USNID 的新框架,它通过三种主要技术实现了无监督半监督的新意图发现,包括利用无监督或半监督数据挖掘浅层语义相似性关系,设计一个质心引导的聚类机制以提供高质量的自我监督目标,以及通过最优化聚类级别和实例级别目标发现细粒度意 - Z-BERT-A: 未知意图识别的零 - shot 管道
通过提出具有 Transformer 结构和 fine-tuning 在 NLI 任务中训练的 Z-BERT-A 的方法,能够在零样本设置下有效地执行意图发现任务,从而能够在线生成新的意图。
- ACL使用预训练和对比学习进行新意图发现
本研究提出一种新的意图发现方法,通过多任务预训练和对比损失优化聚类来学习语义表述以扩展对话系统中支持的意图类别。实验结果表明,该方法在半监督和无监督场景下均优于现有方法。
- COVID-19 疫苗犹豫期意图发现的基准数据和评估框架
该研究介绍了 VIRA,这是一个公共对话系统,旨在解决有关 COVID-19 疫苗的问题和担忧。使用 VIRA 与实际用户进行的 8k 余个对话构成了一个独特的真实世界的对话数据集。该研究还介绍了用于 VIRA 的意图发现的自动评估框架,并 - 利用对比学习的半监督聚类发现新意图
DCSC 是一种半监督的文本聚类方法,可对话系统中的文本样本进行聚类,通过两阶段训练过程利用标记样本,取得最佳聚类性能,从而在文本归类方面取得了最佳性能。
- AAAI通过深度对齐聚类发现新意图
该论文提出了一种基于少量先前标记样本预训练模型来发现新意图、使用 k - 均值产生伪标签、并提出了一种对齐策略来解决聚类分配过程中标签不一致问题的方法,最终在众多测试中表现更为鲁棒且优于现有方法。
- 从过去的对话中挖掘意图信息以供会话代理使用
本文提出了意图发现框架,通过自动聚类类似用户话语并手动注释,再通过对未被聚类映射的话语标记意图标签和标记传播,从原始对话中生成意图训练数据,以有效地解决在聊天机器人开发过程中遇到的用户话语分类问题,并验证了该框架的有效性。