多模态属性提取

Nov, 2017

Multimodal Attribute Extraction

Robert L. Logan IV, Samuel Humeau, Sameer Singh

TL;DR本文提出了一种多模态属性提取任务，旨在从不同类型的非结构化数据中提取实体的属性。通过使用 7 百万个不同产品项目的混合媒体数据集，我们展示了利用弱监督学习方法进行属性提取的有效性，并分析了各种信息模态相对于该任务的作用。

Abstract

The broad goal of information extraction is to derive structured information from unstructured data. However, most existing methods focus solely on text, ignoring other types of →

information extraction multimodal attribute extraction unstructured data weakly supervised learning product items

发现论文，激发创造

电子商务的多模态属性提取

本文介绍了一种基于多模态架构和深度模型的方法，从文本和图像中提取商品属性，旨在改善在线市场的用户体验。在实验中，该方法表现出良好的效果，并成功应用于 Rakuten-Ichiba 等在线市场。

Mar, 2022

电商产品的多模态联合属性预测和价值提取

该研究提出了一种多模式方法，结合了产品图片和文本描述信息，以联合预测产品属性和提取属性值，实现了完备和准确的产品属性值数据集，并在实验中证明了显式建模属性和值之间关系以及选择性地利用产品信息可以提高任务表现。

Sep, 2020

自动从非结构化多语言 Web 数据中提取精细化标准化产品信息

该论文展示了最近机器学习的进展，结合已发表的标准化细粒度产品类别信息的多语言数据集，使得在具有挑战性的迁移学习设置中实现了可靠的产品属性提取，可以跨在线商店、语言或两者可靠地预测产品属性，并且可用于匹配在线零售商之间的产品分类法。

Feb, 2023

电商属性的大规模生成式多模态属性提取

本论文提出了 MXT 框架，利用问题 - 回答任务解决电商产品页属性提取问题，同时提出生成模型，使用文本和图像来预测属性值，该系统能够处理传统分类和命名实体识别难以解决的零样本和无值问题，并使用远程监督训练，降低了维护模型的难度，实验结果表明，该框架的表现优于现有的先进模型。

Jun, 2023

统一学习方案与动态范围最小化提升多模态电子商务属性值提取

该研究旨在通过统一学习方案和动态范围缩小，提高多模式电子商务属性值提取的性能，通过预训练模型和动态范围缩小方法，将多模式任务联合训练，并选择属性原型来改进当前方法的预测性。

Jul, 2022

电子商务中从产品标题中提取属性

本文提出了一种命名实体抽取系统，用于检测像沃尔玛这样的电商零售商产品标题中的属性。我们发现，将条件随机场和结构化感知器等序列标注算法与策略标准化方案结合起来，可以有效地从标题中提取产品属性值。

Aug, 2016

PV2TEA：将视觉模态补充到文本信息提取中

该研究旨在将视觉模态与以文本为基础的属性信息提取器相结合，以提高属性值提取的准确性和性能，在此基础上，该文提出了基于编码器 - 解码器结构的 PV2TEA 模型，通过三种偏差降低方案实现跨模态融合，并实验证明相比于单一模态模型，其性能提高了 20.97%.

Jun, 2023

与你相识：对话中用户属性提取

本文提出了一种利用对话系统中的强提示信息自动提取用户属性的方法，通过远程监督训练两阶段属性提取器，实现了多种基线模型无法超越的效果，并探讨了已提取用户属性的个性化推荐和对话系统应用以及潜在局限性。

Aug, 2019

PAM: 跨产品类别属性提取中的产品图像理解

本文提出了一个全面利用产品图像、光学字符识别（OCR）令牌和文本表示的、统一的属性提取框架，并通过训练解码器来预测产品类别和属性值，从而进一步扩展了该框架的能力。在包含多个产品类别和各种产品属性的电子商务平台上进行了评估，与仅使用文本特征的现有方法相比，该模型在 14 个产品类别上取得了 15％的召回率增益和 10％的 F1 得分增益。

Jun, 2021

非法领域中的信息提取

本论文提出了一种轻量级的特征无关的信息提取（IE）范例，可以处理语言模式不规范、长尾概念漂移等问题，特别适用于人口贩卖等非法领域；经验证明，在低监督和高监督设置下，该范例可以比传统的基于特征的条件随机场提升 18％以上的 F - 度量，并且能够漂移概念稳定性高。

Mar, 2017