一种非参数学习方法用于检测在线人口贩卖
本研究运用来自 “Backpage” 网站的文本数据,利用扩展的 Laplacian SVM 中添加正则化项的 S3VM-R 方法,结合监督和半监督学习,成功识别高度关注的人口贩运在线广告,是一种有效的打击人口贩卖犯罪的方法。
May, 2017
通过先进的自然语言处理技术,本项目解决在线 C2C 市场上的人口贩运问题。我们介绍了一种新的方法论,通过最小的监督生成伪标记数据集,为训练最先进的自然语言处理模型提供了丰富的资源。在人口贩卖风险预测和有组织活动检测等任务中,我们采用了先进的 Transformer 模型进行分析。一个重要的贡献是使用整合梯度实现一个可解释性框架,为执法部门提供关键的可解释性洞察。这项工作不仅填补了文献中的一个重要空白,还提供了一种可扩展的、机器学习驱动的在线人类剥削对策方法。它为未来的研究和实际应用奠定了基础,强调了机器学习在解决复杂社会问题中的作用。
Nov, 2023
采用代理标签的实体分辨管道从在线论坛中提取人类贩卖活动数据,并应用于 5M 条记录的 Backpage.com 数据,并报告了其性能的挑战和领域特定特征
Sep, 2015
介绍了 IDTraffickers 数据集及其在在线伴游市场中验证和识别潜在人口贩卖供应商的作用,通过训练 DeCLUTR-small 模型实现了 0.8656 的宏 F1 得分和 0.8852 的平均 r-precision 得分,旨在促进进一步研究并确保负责任的数据共享,以便将伴游广告与人口贩卖迹象的识别联系起来。
Oct, 2023
该研究的目标是针对自动驾驶汽车开发一种基于创新的音频分析的人口贩运侦测框架,使用一维卷积神经网络可以将人口贩卖受害者的声音从非人口贩卖声音中区分出来,准确率达 95%。
Sep, 2022
该论文使用整数线性规划模型,结合上下文、限制条件和开放的地理名称知识库来提高人口贩卖定位标记的精度和 F - 度量。实验结果表明,相比于基于机器学习的基线,该框架可提高 28.57%的精度和 36.9%的 F - 度量。这种方法已被广泛应用于美国执法部门,以打击人口贩卖。
Apr, 2017
我们研究了构建数据集以了解组织活动和人类贩卖主题风险的挑战,包括数据稀缺性、迅速过时和隐私问题。我们开发了可重现和自动化的方法分析了五百万个广告,并在此过程中发现了在该敏感领域中创建数据集的进一步挑战。本文提出了一种简化的方法来帮助研究人员构建有效的数据集以打击有组织犯罪,使他们能够专注于提升检测技术。
May, 2024
通过评估当前计算机视觉技术在多媒体地理定位中的潜力,综述了其应用,识别了其在打击人口贩卖方面的适用性,并强调了增强多媒体地理定位对起诉人口贩卖的潜在影响。
Feb, 2024
通过利用大型语言模型 (ChatGPT) 和知识驱动提示构建的分析框架,我们首次对社交媒体上的非法药物交易活动进行了系统研究,实验结果表明该框架在药物贩运检测准确性方面优于其他基准语言模型,该研究可为社交网络提供有效的药物贩运识别和标注,甚至在非法药物交易者使用隐晦语言和委婉语避免检测的情况下仍然有效。
Jul, 2023