弱监督下可扩展的银行交易分类

May, 2023

Scalable and Weakly Supervised Bank Transaction Classification

Liam Toran, Cory Van Der Walt, Alan Sammarone, Alex Keller

TL;DR该研究使用弱监督、自然语言处理和深度神经网络技术对银行交易进行分类，建立了一个高效可扩展的数据处理管道，展示出比现有市场领先解决方案更有效的分类性能，并能快速扩展到新的使用案例，从而提高了金融健康报告和信用风险评估等金融应用的可用性。

Abstract

This paper aims to categorize bank transactions using weak supervision, natural language processing, and →

bank transactions weak supervision natural language processing deep neural network financial applications

发现论文，激发创造

基于专用标注语料库的支持向量机短文本分类识别银行交易描述

通过结合自然语言处理技术与机器学习算法，我们描述了一个将银行交易描述分类为个人财务管理的新系统，在一个实际客户交易数据集上进行了训练和测试，并在与其他方法的比较中表现出较高的准确性，同时考虑了复杂性和计算时间。

Mar, 2024

弱监督神经文本分类

本文提出了一种弱监督文本分类方法，其包括一个利用种子信息生成伪标签文档进行模型预训练的伪文档生成器和一个在真实未标记数据上引导模型改进的自训练模块，具有处理不同类型弱监督任务和易于与深度神经网络模型集成等优点，并在三个真实数据集上进行了广泛的实验，结果表明其大幅优于基准方法而不需要过多的训练数据。

Sep, 2018

弱监督层次文本分类

本文提出了一种弱监督的神经方法进行层次文本分类，通过生成伪文档进行模型预训练，并在真实无标签数据上进行自我训练，最终得到高效准确的分类模型。

Dec, 2018

一种使用弱监督和迁移学习的自动 SOAP 分类系统

本文提出了一种基于机器学习的 SOAP 分类系统的综合框架，该框架使用基于规则的弱标记方法构建标记数据集，并使用双向 LSTM 和条件随机场 (CRF) 组成了分类器。研究表明，该弱标记算法可以在没有手动标记数据的情况下在同一医院的 EHR 笔记上进行 SOAP 分类，而迁移学习可以提高跨医院和部门的准确性。

Nov, 2022

利用机器学习检测金融交易描述中的滥用

本研究介绍了澳大利亚联邦银行人工智能实验室开发的基于深度学习自然语言处理（NLP）模型的新系统，旨在识别和控制使用新支付平台非法通信、家庭暴力等行为，提高银行服务的安全性和稳定性。

Mar, 2023

金融欺诈检测的文本数据挖掘：深度学习方法

使用深度学习的方法对金融欺诈文本进行自然语言处理的二元分类任务，并且通过不同种类的神经网络模型，包括多层感知机、RNN、LSTM 和 GRU 等，进行了准确性比较，为金融欺诈检测领域提供了有价值的见解。

Aug, 2023

利用大量弱监督数据进行多语言情感分类

本文提出了一种新的多语言情感分类方法，使用了大量的弱监督数据训练多层卷积网络，通过在多种语言数据集上进行充分的评估，证明该方法的优异性能，达到了同类研究的最高水平。

Mar, 2017

走向基础采购模型：事务序列上的预训练生成自回归

通过生成预训练方法，获得金融交易的上下文嵌入表示，以提高卡片欺诈检测问题的价值检测率，并在不同领域中得到很好的迁移效果。

Jan, 2024

基于领域约束的弱监督学习可扩展技术

提出了一种使用符号域知识作为约束条件的新型可扩展端到端管道，用于学习神经网络以弱监督方式对未标记数据进行分类。该方法尤其适用于数据由不同组（类）组成且适合于聚类友好型表示学习的设置，并且可以通过同时考虑多个训练示例来重新制定领域约束以采用有效的数学优化技术。我们在 MNIST 图像分类问题的变体上进行了评估，其中训练示例由图像序列和表示序列中数字的总和组成，并且表明我们的方法比先前依赖于计算每个训练示例的所有约束满足组合的方法具有更大的可扩展性。

Jan, 2023

利用弱监督生成印尼保护数据集

利用弱监督方法快速构建印尼自然语言处理数据集，通过使用标注函数生成软标签数据集，进行多类别分类和情感分类的基准实验，得到了相应的测试性能结果，并提供了数据集和标注函数以供进一步研究和探索。

Oct, 2023