通过对比预训练提升多领域B2B云解决方案匹配
提出了 exttt{NeuSearcher} 算法解决大规模、动态的二部匹配问题,该算法基于多通道图神经网络,通过预测匹配边的权重阈值显著减少搜索区域,并结合并行启发式搜索算法迭代提高解决方案的质量,实验证明这种方法能提高2至3倍的运行速度,同时实现与最先进的近似算法相同的匹配解决方案。
May, 2020
本文首次将有监督对比学习应用于电子商务中的产品匹配任务,使用来自不同电商的产品提供,通过对有标签的对比学习进行预训练,并提出了一种源感知采样策略,能够在训练数据不包含产品标识符的使用用例中使用对比学习,实验结果表明对比预训练与源感知采样相结合,可以显著提高多个广泛使用的基准测试性能,并在有明确监督的产品匹配用例中具有很高的潜力。
Feb, 2022
针对多轮匹配问题,我们在普遍应用实践中探究了解决资源与代理人之间的配对问题的方法,并研究了不同类型的收益函数的解决策略,同时针对不同的场景,我们提出了整数线性规划和基于局部搜索的启发式算法。
Nov, 2022
该研究介绍了一种数据分享平衡框架,用于分析数据分享所带来的利益和损失,并研究了市场条件对合作动机的影响。研究结果表明,市场竞争的缩小和更难的学习任务会促进数据分享的合作性。
May, 2023
通过模型对用户-商品的互动矩阵进行建模,并提出了一个修正双向偏差的损失函数,我们提出了一个统一的用户-商品匹配框架,以实现商品推荐和用户定位,深度减少了计算资源和日常维护成本,从而证明了我们的框架相对于现有方法的显著性能提升。
Jul, 2023
本研究提出了TPDR,一种基于Transformer的产品描述标准化和类别检索方法,能够利用注意机制和对比学习来探索IS和SD之间的语义对应关系,并结合句法特征进行重新排序,实验证明该方法在真实公司环境中取得了显著的效果提升。
Oct, 2023
在线市场与电子商务公司中,产品匹配是识别同一产品不同表示以提高可发现性、整理性和定价性的重要能力。我们在一个行业环境中提出了一个强大的多模态产品匹配系统,其中大规模的数据集、数据分布转移和未知领域带来了挑战。我们比较了不同的方法,并得出结论,通过预先训练的图像和文本编码器的相对简单的投影,通过对比学习进行训练,可以在成本和性能方面取得最新的结果。我们的解决方案优于单模态匹配系统和大规模预训练模型,例如CLIP。此外,我们展示了如何将人机协作过程与基于模型的预测相结合,实现在生产系统中接近完美的精度。
Mar, 2024
通过与数据科学家合作,领域专家从各个领域共同探索使用机器学习技术解决问题。本文侧重于领域问题、机器学习问题和主要机器学习解决方案的表示,以及帮助领域专家探索机器学习解决空间的启发式匹配函数,以确定适合领域问题的机器学习算法族。
Jun, 2024
将任务分配给服务提供者是各种应用中常见的过程,为了防止服务提供者过载而导致任务被拒绝,需要考虑公平性。本文将该问题建模为二部图中的在线匹配,并解决了两个极小极大问题:一个旨在最小化任务的最长等待时间,另一个旨在最小化服务提供者的最高工作负载。我们展示了第二个问题可以表示为线性规划,并且可以在保持对第一个问题目标合理逼近的同时有效求解。我们开发了基于线性规划的创新方法,并使用真实数据进行了大量的模拟实验,展示了我们的创新启发式方法的出色性能。
May, 2024