早期分类多模态序列
本研究探讨了巴西最高法院文件的多模式分类,采用 ResNet 与多核卷积神经网络提取视觉和文本特征以及 biLSTM 网络建模页面的序列性,发现多模式分类优于单一模式分类。
Jul, 2022
本研究提出了一种更灵活的早期分类流程,将早期分类范例扩展到通道维度,并利用强化学习技术和约束条件来实现此方法,在合成数据上进行实验并在实际数据集上评估其性能,结果表明该方法可以通过实现更精确的分类来增强早期分类范例。
Jun, 2023
本研究基于文本和图像模态探讨了一种基于多模态晚期融合的方法,以对 Rakuten 上的电子商务产品进行分类,并证明了该方法相比于单模态和其他多模态方法的有效性和优越性。该研究团队在 SIGIR 2020 电子商务研讨会数据挑战赛的多模态产品分类任务中以 0.9144 的 macro-F1 得分荣获第一名。
Aug, 2020
本文提出了一种采用新的优化准则的分类算法,该准则考虑了分类错误的成本和等待决策的成本,并尝试通过使用聚类或分类器来减少误判和延迟的影响,实验结果表明,这种方法优于传统的基于经验策略的方法。
May, 2020
提出了一种基于多模态数据的关注机制的序列推荐方法,该方法利用图像、文字和类别等多模态数据,利用 attention 操作和多任务学习损失,提高了推荐系统的性能。
May, 2024
本文通过构建数据集和收集人类注释来检验机器学习模型分析和排序多模式事件的能力,发现机器模型不仅表现远远不如人类,而且不能有效地利用多模式信息。为了改善机器在多模式事件排序上的性能,作者提出了针对顺序性的预训练技术,可以获得显著的 > 5% 的性能提升。
Oct, 2021
本文系统地回顾了当前文献中针对一元和多元时间序列早期分类的各种方法,将这些方法划分为基于前缀、基于形状、基于模型和其他方法四个类别,并讨论了在医疗保健、金融和智能交通等领域中早期分类的应用。未来的研究方向也得到了总结。
May, 2020
本文研究多模态分类问题,其中一种模态是离散的文本,另一种模态是连续的视觉表示,我们针对需要快速分类大量数据的情况进行分析,提出了多种方法进行多模态融合,并分析了它们在分类精度和计算效率上的权衡。结果表明,连续信息的引入可以有效提高多模态分类任务的性能,并克服了融合过程的复杂性和消耗的计算资源。此外,本文还介绍了一种分割连续特征以进一步加速和简化融合过程的方法,在提高解释性的同时超越了单一文本分类的精度。
Feb, 2018