在线市场产品分类:一种集成方法
本研究回顾了针对大规模电子商务目录的产品项分类问题。我们提出了一种基于深度学习的分类模型框架,利用多个分类器的组合和融合来改善分类性能,并使用元数据特征和低级特征工程来提升模型质量。此外,我们还提出了一种使用用户会话评估模型性能的新方法,相较于传统的精确度和召回率等评估指标,提供更详尽的洞察力。
Jul, 2023
本研究基于文本和图像模态探讨了一种基于多模态晚期融合的方法,以对 Rakuten 上的电子商务产品进行分类,并证明了该方法相比于单模态和其他多模态方法的有效性和优越性。该研究团队在 SIGIR 2020 电子商务研讨会数据挑战赛的多模态产品分类任务中以 0.9144 的 macro-F1 得分荣获第一名。
Aug, 2020
我们提出了一种创新的集成方法来进行情感分析以找到伪造评论,它结合了支持向量机、K 最近邻算法和决策树分类器的预测能力,从而在伪造评论预测中实现了卓越的准确性和鲁棒性,突显了集成技术在使用混合算法中开展伪造评论研究方面的潜力。
Apr, 2024
该论文采用决策级融合方法将文本和图像输入用于产品分类预测,通过训练深度神经网络和学习网络来选择输入类型,并成功地提高了大规模产品分类数据集上的准确性。
Nov, 2016
本研究提出了一种多模态模型,通过使用多个神经网络模型从文本(CamemBERT 和 FlauBERT)和视觉数据(SE-ResNeXt-50)提取的特征,并采用简单的融合技术,显著提高了单一模态模型的性能和类似模型性能,我们实验了多种融合技术,并发现将单一模态网络的个体嵌入组合为特征向量的拼接和平均值结合的性能最好,每种模态互补了其他模态的缺点,证明增加模态数量可以是改善多标签和多模态分类问题性能的有效方法。
Jul, 2022
基于物体分类的识别方法研究中,对象的变化是一个挑战。本研究提出了一种分类方法,使用投票和组合分类器,结合随机森林、K-NN、决策树、SVM 和朴素贝叶斯分类方法。测试结果表明,投票方法和组合分类器的准确率分别为 92.4% 和 99.3%。研究结果显示,使用组合分类器和投票方法可以提高对象分类准确性,增加了集成学习方法的有效性。
Sep, 2023
本文研究了使用基于层次模型和平面模型的两个深度学习模型,以及结合结构化和非结构化特征的卷积滤波的新方法,以解决电子商务中几千个类别和数百万个产品的产品分类问题。
Mar, 2019
应用先进的机器学习模型(特别是 LSTM 和 BERT)进行文本分类以预测零售行业中的多个类别,并演示了如何应用数据增强技术和焦点损失函数可以显著提高使用强大的巴西零售数据集将产品分类到多个类别的准确性。
Mar, 2024
本文针对 UNSW-NB15 数据集的类不平衡和特征空间中的类重叠问题,提出了一种机器学习分类器的数据驱动设计和性能评估方法,其中使用 Balanced Bagging、eXtreme Gradient Boosting、Hellinger Distance Decision Tree 等集成方法来解决不平衡数据问题,提出了两种新的算法来解决类重叠问题,并提高了测试数据的分类性能。实验证明,相比已有技术,该方法在二元和多种情况下均有显著优势。
May, 2022
本文提出了一种基于机器翻译的产品分类新范式,通过将产品的自然语言描述翻译成代表产品分类树中从根到叶子的路径的一系列标记,实现了比最先进的分类系统更好的预测准确性,并且可以在分类树中提出有意义的新路径,将其转换为有向无环图,从而有助于用户友好浏览和适应新产品的分类。
Dec, 2018