一种非参数学习方法用于检测在线人口贩卖

Jul, 2016

一种非参数学习方法用于检测在线人口贩卖

A Non-Parametric Learning Approach to Identify Online Human Trafficking

Hamidreza Alvari, Paulo Shakarian, J.E. Kelly Snyder

TL;DR本研究通过对 Backpage 网站上与人口贩运相关的在线活动展开分析，采用半监督式学习方法，依靠所提取的带标签和未标签数据进行训练。该方法经过专家的进一步验证并在未见过的数据集上进行评估。

Abstract

human trafficking is among the most challenging law enforcement problems which demands persistent fight against from all over the globe. In this study, we leverage readily available data from the website "backpage

human trafficking backpage classified advertisement semi-supervised learning online activity

发现论文，激发创造

检测人口贩卖的半监督学习

本研究运用来自 “Backpage” 网站的文本数据，利用扩展的 Laplacian SVM 中添加正则化项的 S3VM-R 方法，结合监督和半监督学习，成功识别高度关注的人口贩运在线广告，是一种有效的打击人口贩卖犯罪的方法。

May, 2017

打击网络空间中的人口贩卖：基于自然语言处理的在线广告语言分析方法

通过先进的自然语言处理技术，本项目解决在线 C2C 市场上的人口贩运问题。我们介绍了一种新的方法论，通过最小的监督生成伪标记数据集，为训练最先进的自然语言处理模型提供了丰富的资源。在人口贩卖风险预测和有组织活动检测等任务中，我们采用了先进的 Transformer 模型进行分析。一个重要的贡献是使用整合梯度实现一个可解释性框架，为执法部门提供关键的可解释性洞察。这项工作不仅填补了文献中的一个重要空白，还提供了一种可扩展的、机器学习驱动的在线人类剥削对策方法。它为未来的研究和实际应用奠定了基础，强调了机器学习在解决复杂社会问题中的作用。

Nov, 2023

一种实体解析方法以分离在线人口贩卖实例

采用代理标签的实体分辨管道从在线论坛中提取人类贩卖活动数据，并应用于 5M 条记录的 Backpage.com 数据，并报告了其性能的挑战和领域特定特征

Sep, 2015

IDTraffickers: 关联和连接潜在人口贩运行动的作者识别数据集

介绍了 IDTraffickers 数据集及其在在线伴游市场中验证和识别潜在人口贩卖供应商的作用，通过训练 DeCLUTR-small 模型实现了 0.8656 的宏 F1 得分和 0.8852 的平均 r-precision 得分，旨在促进进一步研究并确保负责任的数据共享，以便将伴游广告与人口贩卖迹象的识别联系起来。

Oct, 2023

基于音频分析的自主驾驶交通工具人口贩卖检测框架

该研究的目标是针对自动驾驶汽车开发一种基于创新的音频分析的人口贩运侦测框架，使用一维卷积神经网络可以将人口贩卖受害者的声音从非人口贩卖声音中区分出来，准确率达 95%。

Sep, 2022

利用背景与限制条件改善对人口贩卖网页的地理标记

该论文使用整数线性规划模型，结合上下文、限制条件和开放的地理名称知识库来提高人口贩卖定位标记的精度和 F - 度量。实验结果表明，相比于基于机器学习的基线，该框架可提高 28.57％的精度和 36.9％的 F - 度量。这种方法已被广泛应用于美国执法部门，以打击人口贩卖。

Apr, 2017

关于构建用于分析商业性服务广告以评估人口贩卖风险和有组织活动的数据集的挑战

我们研究了构建数据集以了解组织活动和人类贩卖主题风险的挑战，包括数据稀缺性、迅速过时和隐私问题。我们开发了可重现和自动化的方法分析了五百万个广告，并在此过程中发现了在该敏感领域中创建数据集的进一步挑战。本文提出了一种简化的方法来帮助研究人员构建有效的数据集以打击有组织犯罪，使他们能够专注于提升检测技术。

May, 2024

计算机视觉在人类贩卖调查中的多媒体地理定位研究：系统文献综述

通过评估当前计算机视觉技术在多媒体地理定位中的潜力，综述了其应用，识别了其在打击人口贩卖方面的适用性，并强调了增强多媒体地理定位对起诉人口贩卖的潜在影响。

Feb, 2024

能否自动化分析在线儿童性剥削话语？

通过心理学理论标记儿童色情犯罪者的对话行为，使用自动化与基于自然语言推理的模型代替领域专家来识别谈话行为

Sep, 2022

揭示知识引导的 ChatGPT 在社交媒体上提升毒品走私检测的潜力

通过利用大型语言模型 (ChatGPT) 和知识驱动提示构建的分析框架，我们首次对社交媒体上的非法药物交易活动进行了系统研究，实验结果表明该框架在药物贩运检测准确性方面优于其他基准语言模型，该研究可为社交网络提供有效的药物贩运识别和标注，甚至在非法药物交易者使用隐晦语言和委婉语避免检测的情况下仍然有效。

Jul, 2023