在线市场产品分类：一种集成方法

Apr, 2023

在线市场产品分类：一种集成方法

Categorising Products in an Online Marketplace: An Ensemble Approach

Kieron Drumm

TL;DR本研究提出了一种集成方法，通过使用不同的模型分别预测产品的类别、子类别和颜色并将结果结合，从而在预测这些特征时可以实现平均 F1 - 得分为 0.82，适用于电商公司的产品分类问题。

Abstract

In recent years, product categorisation has been a common issue for e-commerce companies who have utilised machine learning to categorise

e-commerce machine learning product categorisation ensemble approach f1-score

发现论文，激发创造

面向产品项目分类的多输出头集成

本研究回顾了针对大规模电子商务目录的产品项分类问题。我们提出了一种基于深度学习的分类模型框架，利用多个分类器的组合和融合来改善分类性能，并使用元数据特征和低级特征工程来提升模型质量。此外，我们还提出了一种使用用户会话评估模型性能的新方法，相较于传统的精确度和召回率等评估指标，提供更详尽的洞察力。

Jul, 2023

一种用于电子商务产品分类的多模态后融合模型

本研究基于文本和图像模态探讨了一种基于多模态晚期融合的方法，以对 Rakuten 上的电子商务产品进行分类，并证明了该方法相比于单模态和其他多模态方法的有效性和优越性。该研究团队在 SIGIR 2020 电子商务研讨会数据挑战赛的多模态产品分类任务中以 0.9144 的 macro-F1 得分荣获第一名。

Aug, 2020

在电子商务平台中使用混合算法寻找虚假评论

我们提出了一种创新的集成方法来进行情感分析以找到伪造评论，它结合了支持向量机、K 最近邻算法和决策树分类器的预测能力，从而在伪造评论预测中实现了卓越的准确性和鲁棒性，突显了集成技术在使用混合算法中开展伪造评论研究方面的潜力。

Apr, 2024

一张图 worth 一千字吗？一种深度多模融合 e-commerce 商品分类模型

该论文采用决策级融合方法将文本和图像输入用于产品分类预测，通过训练深度神经网络和学习网络来选择输入类型，并成功地提高了大规模产品分类数据集上的准确性。

Nov, 2016

基于层次融合的多模态电子商务产品分类

本研究提出了一种多模态模型，通过使用多个神经网络模型从文本（CamemBERT 和 FlauBERT）和视觉数据（SE-ResNeXt-50）提取的特征，并采用简单的融合技术，显著提高了单一模态模型的性能和类似模型性能，我们实验了多种融合技术，并发现将单一模态网络的个体嵌入组合为特征向量的拼接和平均值结合的性能最好，每种模态互补了其他模态的缺点，证明增加模态数量可以是改善多标签和多模态分类问题性能的有效方法。

Jul, 2022

基于灰度共生矩阵和直方图提取的集成学习目标分类模型

基于物体分类的识别方法研究中，对象的变化是一个挑战。本研究提出了一种分类方法，使用投票和组合分类器，结合随机森林、K-NN、决策树、SVM 和朴素贝叶斯分类方法。测试结果表明，投票方法和组合分类器的准确率分别为 92.4% 和 99.3%。研究结果显示，使用组合分类器和投票方法可以提高对象分类准确性，增加了集成学习方法的有效性。

Sep, 2023

大规模产品分类与结构化 / 非结构化属性

本文研究了使用基于层次模型和平面模型的两个深度学习模型，以及结合结构化和非结构化特征的卷积滤波的新方法，以解决电子商务中几千个类别和数百万个产品的产品分类问题。

Mar, 2019

多级产品类别预测通过文本分类

应用先进的机器学习模型（特别是 LSTM 和 BERT）进行文本分类以预测零售行业中的多个类别，并演示了如何应用数据增强技术和焦点损失函数可以显著提高使用强大的巴西零售数据集将产品分类到多个类别的准确性。

Mar, 2024

针对网络入侵检测数据集特征调整的集成分类器设计

本文针对 UNSW-NB15 数据集的类不平衡和特征空间中的类重叠问题，提出了一种机器学习分类器的数据驱动设计和性能评估方法，其中使用 Balanced Bagging、eXtreme Gradient Boosting、Hellinger Distance Decision Tree 等集成方法来解决不平衡数据问题，提出了两种新的算法来解决类重叠问题，并提高了测试数据的分类性能。实验证明，相比已有技术，该方法在二元和多种情况下均有显著优势。

May, 2022

不分类，翻译：通过机器翻译进行多级电子商务产品分类

本文提出了一种基于机器翻译的产品分类新范式，通过将产品的自然语言描述翻译成代表产品分类树中从根到叶子的路径的一系列标记，实现了比最先进的分类系统更好的预测准确性，并且可以在分类树中提出有意义的新路径，将其转换为有向无环图，从而有助于用户友好浏览和适应新产品的分类。

Dec, 2018