弱监督下可扩展的银行交易分类
通过结合自然语言处理技术与机器学习算法,我们描述了一个将银行交易描述分类为个人财务管理的新系统,在一个实际客户交易数据集上进行了训练和测试,并在与其他方法的比较中表现出较高的准确性,同时考虑了复杂性和计算时间。
Mar, 2024
本文提出了一种弱监督文本分类方法,其包括一个利用种子信息生成伪标签文档进行模型预训练的伪文档生成器和一个在真实未标记数据上引导模型改进的自训练模块,具有处理不同类型弱监督任务和易于与深度神经网络模型集成等优点,并在三个真实数据集上进行了广泛的实验,结果表明其大幅优于基准方法而不需要过多的训练数据。
Sep, 2018
本文提出了一种基于机器学习的 SOAP 分类系统的综合框架,该框架使用基于规则的弱标记方法构建标记数据集,并使用双向 LSTM 和条件随机场 (CRF) 组成了分类器。研究表明,该弱标记算法可以在没有手动标记数据的情况下在同一医院的 EHR 笔记上进行 SOAP 分类,而迁移学习可以提高跨医院和部门的准确性。
Nov, 2022
本研究介绍了澳大利亚联邦银行人工智能实验室开发的基于深度学习自然语言处理(NLP)模型的新系统,旨在识别和控制使用新支付平台非法通信、家庭暴力等行为,提高银行服务的安全性和稳定性。
Mar, 2023
使用深度学习的方法对金融欺诈文本进行自然语言处理的二元分类任务,并且通过不同种类的神经网络模型,包括多层感知机、RNN、LSTM 和 GRU 等,进行了准确性比较,为金融欺诈检测领域提供了有价值的见解。
Aug, 2023
本文提出了一种新的多语言情感分类方法,使用了大量的弱监督数据训练多层卷积网络,通过在多种语言数据集上进行充分的评估,证明该方法的优异性能,达到了同类研究的最高水平。
Mar, 2017
提出了一种使用符号域知识作为约束条件的新型可扩展端到端管道,用于学习神经网络以弱监督方式对未标记数据进行分类。该方法尤其适用于数据由不同组(类)组成且适合于聚类友好型表示学习的设置,并且可以通过同时考虑多个训练示例来重新制定领域约束以采用有效的数学优化技术。我们在 MNIST 图像分类问题的变体上进行了评估,其中训练示例由图像序列和表示序列中数字的总和组成,并且表明我们的方法比先前依赖于计算每个训练示例的所有约束满足组合的方法具有更大的可扩展性。
Jan, 2023
利用弱监督方法快速构建印尼自然语言处理数据集,通过使用标注函数生成软标签数据集,进行多类别分类和情感分类的基准实验,得到了相应的测试性能结果,并提供了数据集和标注函数以供进一步研究和探索。
Oct, 2023