一种用于电子商务产品分类的多模态后融合模型
该论文采用决策级融合方法将文本和图像输入用于产品分类预测,通过训练深度神经网络和学习网络来选择输入类型,并成功地提高了大规模产品分类数据集上的准确性。
Nov, 2016
本研究提出了一种多模态模型,通过使用多个神经网络模型从文本(CamemBERT 和 FlauBERT)和视觉数据(SE-ResNeXt-50)提取的特征,并采用简单的融合技术,显著提高了单一模态模型的性能和类似模型性能,我们实验了多种融合技术,并发现将单一模态网络的个体嵌入组合为特征向量的拼接和平均值结合的性能最好,每种模态互补了其他模态的缺点,证明增加模态数量可以是改善多标签和多模态分类问题性能的有效方法。
Jul, 2022
本文介绍了一种基于多模态架构和深度模型的方法,从文本和图像中提取商品属性,旨在改善在线市场的用户体验。在实验中,该方法表现出良好的效果,并成功应用于 Rakuten-Ichiba 等在线市场。
Mar, 2022
在线市场与电子商务公司中,产品匹配是识别同一产品不同表示以提高可发现性、整理性和定价性的重要能力。我们在一个行业环境中提出了一个强大的多模态产品匹配系统,其中大规模的数据集、数据分布转移和未知领域带来了挑战。我们比较了不同的方法,并得出结论,通过预先训练的图像和文本编码器的相对简单的投影,通过对比学习进行训练,可以在成本和性能方面取得最新的结果。我们的解决方案优于单模态匹配系统和大规模预训练模型,例如 CLIP。此外,我们展示了如何将人机协作过程与基于模型的预测相结合,实现在生产系统中接近完美的精度。
Mar, 2024
该论文提出一种名为 K3M 的新方法,通过引入知识模态来进行多模态预训练,以解决实际 E-commerce 场景中的产品数据中存在的多模态噪声和缺失问题,并在真实世界的 E-commerce 数据集和一系列基于产品的下游任务上显示出明显的性能提升。
Aug, 2021
该研究提出了一种多模式方法,结合了产品图片和文本描述信息,以联合预测产品属性和提取属性值,实现了完备和准确的产品属性值数据集,并在实验中证明了显式建模属性和值之间关系以及选择性地利用产品信息可以提高任务表现。
Sep, 2020
该研究提出了一种名为 “时尚聚焦” 的多模态检索系统的创新演示,用于自动实现准确的视频到购物匹配,该系统结合图像、文本、交互等不同模态的特征,通过视频内容的结构化和多模态检索过程实现。
Feb, 2021
提出了一种基于多模态数据的关注机制的序列推荐方法,该方法利用图像、文字和类别等多模态数据,利用 attention 操作和多任务学习损失,提高了推荐系统的性能。
May, 2024