多模态属性提取
本文介绍了一种基于多模态架构和深度模型的方法,从文本和图像中提取商品属性,旨在改善在线市场的用户体验。在实验中,该方法表现出良好的效果,并成功应用于 Rakuten-Ichiba 等在线市场。
Mar, 2022
该研究提出了一种多模式方法,结合了产品图片和文本描述信息,以联合预测产品属性和提取属性值,实现了完备和准确的产品属性值数据集,并在实验中证明了显式建模属性和值之间关系以及选择性地利用产品信息可以提高任务表现。
Sep, 2020
该论文展示了最近机器学习的进展,结合已发表的标准化细粒度产品类别信息的多语言数据集,使得在具有挑战性的迁移学习设置中实现了可靠的产品属性提取,可以跨在线商店、语言或两者可靠地预测产品属性,并且可用于匹配在线零售商之间的产品分类法。
Feb, 2023
本论文提出了 MXT 框架,利用问题 - 回答任务解决电商产品页属性提取问题,同时提出生成模型,使用文本和图像来预测属性值,该系统能够处理传统分类和命名实体识别难以解决的零样本和无值问题,并使用远程监督训练,降低了维护模型的难度,实验结果表明,该框架的表现优于现有的先进模型。
Jun, 2023
该研究旨在通过统一学习方案和动态范围缩小,提高多模式电子商务属性值提取的性能,通过预训练模型和动态范围缩小方法,将多模式任务联合训练,并选择属性原型来改进当前方法的预测性。
Jul, 2022
本文提出了一种命名实体抽取系统,用于检测像沃尔玛这样的电商零售商产品标题中的属性。我们发现,将条件随机场和结构化感知器等序列标注算法与策略标准化方案结合起来,可以有效地从标题中提取产品属性值。
Aug, 2016
该研究旨在将视觉模态与以文本为基础的属性信息提取器相结合,以提高属性值提取的准确性和性能,在此基础上,该文提出了基于编码器 - 解码器结构的 PV2TEA 模型,通过三种偏差降低方案实现跨模态融合,并实验证明相比于单一模态模型,其性能提高了 20.97%.
Jun, 2023
本文提出了一种利用对话系统中的强提示信息自动提取用户属性的方法,通过远程监督训练两阶段属性提取器,实现了多种基线模型无法超越的效果,并探讨了已提取用户属性的个性化推荐和对话系统应用以及潜在局限性。
Aug, 2019
本文提出了一个全面利用产品图像、光学字符识别(OCR)令牌和文本表示的、统一的属性提取框架,并通过训练解码器来预测产品类别和属性值,从而进一步扩展了该框架的能力。在包含多个产品类别和各种产品属性的电子商务平台上进行了评估,与仅使用文本特征的现有方法相比,该模型在 14 个产品类别上取得了 15%的召回率增益和 10%的 F1 得分增益。
Jun, 2021
本论文提出了一种轻量级的特征无关的信息提取 (IE)范例,可以处理语言模式不规范、长尾概念漂移等问题,特别适用于人口贩卖等非法领域;经验证明,在低监督和高监督设置下,该范例可以比传统的基于特征的条件随机场提升 18%以上的 F - 度量,并且能够漂移概念稳定性高。
Mar, 2017