May, 2024
FinEmbedDiff: 使用多模态嵌入模型和向量抽样的成本有效的金融文档分类方法
FinEmbedDiff: A Cost-Effective Approach of Classifying Financial Documents with Vector Sampling using Multi-modal Embedding Models
Anjanava Biswas, Wrick Talukdar
TL;DR我们提出了一种成本效益的向量取样方法 FinEmbedDiff,利用预训练的多模态嵌入模型对金融文件进行分类,实现了与最先进基线相媲美的分类准确性,并显著降低了计算成本。该方法具备强大的泛化能力,是解决实际金融应用中多模态文件分类问题的可行且可扩展的解决方案。