本文介绍了一种基于云的系统,使用机器学习方法集成到管道中,能够从客户评论中提取洞察力,其复合模型使用基于 transformer 的神经网络、基于向量嵌入的关键字提取和聚类,可以更好地满足高效信息提取、提取信息的主题建模和用户需求的要求,并且比现有的主题建模和关键字提取解决方案取得更好的结果。该方法使用公开可用的数据集进行基准测试,并与其他最先进的方法进行验证和比较。
Jun, 2023
社交媒体时代为企业开启了新的机遇,但其中的文本数据分析则面临着诸多挑战。本研究针对嘈杂、大数据背景下的无监督主题提取问题,提出了三种基于变分自编码器框架的方法,并在实际使用案例中对这些方法进行了测试,证明了它们相较于现有方法在主题建模领域能够取得同等或更好的性能,并指出主题建模领域需要改进评估指标。
Jul, 2023
在线社交网络平台的指数增长导致了大量的用户生成文本内容,这包括评论和评价。为了解决这一挑战,机器学习和自然语言处理算法已经应用于分析在线可用的大量文本数据。在最近几年,主题建模技术在该领域中获得了显著的流行度。本研究全面研究和比较了特定应用于客户评价的五种常用主题建模方法,通过在实际场景中展示它们在检测重要主题方面的益处,旨在突出它们的功效。我们通过精心选择两个文本数据集来评估这些主题建模方法的性能,评估是基于标准的统计评估指标如主题连贯性得分。我们的发现揭示了 BERTopic 在提取有意义的主题方面始终表现出色并取得了良好的结果。
Aug, 2023
本文通过探索来自词嵌入、语言模型功能以及词嵌入空间的拓扑特征等不同特征,实现了系统以纯数据驱动的方式在对话中发现领域、插槽和值的实现,并在 Schema-Guided Dialogue 数据集中取得了优异结果,结果表明这种方法对本体论归纳以及继续开发对话和自然语言处理研究具有重要意义。
Aug, 2022
本文描述了一个使用 Kaldi 框架的语音文本处理方法,在不同的语义标记方法中选择组合机器学习模型,并使用决策树进行标记的实验。结果表明,该方法提供了更好的性能和更可解释的模型,对数据准备的复杂性做出了改进,能够对联系中心的运营产生潜在影响。
Mar, 2022
本文提出了一个通过摘要网络和层次聚类技术来提取客户提问的框架,同时对客户的问题进行语法和语义相似度分析,并采用 TF-IDF 和 BERT 计算相似性得分。
Sep, 2021
该论文介绍了一种在电商平台中保证产品安全的机制,针对客户的投诉信息使用自然语言处理技术进行分析,将核心业务问题映射到监督文本分类问题,并通过关键绩效指标驱动的评估,最终使用 NLP 模型部署解决该问题。
Oct, 2022
本文介绍了两种自然语言处理技术(词袋和 TF-IDF)以及各种机器学习分类算法(支持向量机,逻辑回归,多项式朴素贝叶斯,随机森林)来分析大型,不平衡和多类数据集上的情感分析。最佳方法使用支持向量机和逻辑回归的词袋技术提供 77%的准确性。
Oct, 2021
我们开发了一种基于自然语言处理的程序,用于检测消费者投诉中的系统性非可取行为,称为系统性异常,而不是检测重大异常,对于小型和频繁的系统性异常,由于各种原因,包括技术原因和人为分析师的自然限制,算法可能会失效。因此,在分类之后的下一步,我们将投诉描述转换为定量数据,然后使用一种检测系统性异常的算法进行分析。我们使用消费者金融保护局的消费者投诉数据库中的投诉描述来说明整个过程。
本文提出了一个基于即时聊天的客户支持 (CS) 互动的框架,用于预测个体用户的推荐决策。通过分析一家拉丁美洲大型电子商务公司金融垂直领域内的 16.4k 用户和 48.7k 客户支持对话,本研究的主要贡献和目标是利用自然语言处理(NLP)来评估和预测推荐行为,在使用静态情感分析的同时利用每个用户的情感动态的预测能力。结果表明,通过信息级别的情感演变,可以完全自动化地预测用户推荐产品或服务的概率以及相关的功能解释。
Nov, 2022