ACLApr, 2022

深入探索暗网语言

TL;DR本研究介绍了一个名为 CoDA 的数据集,该数据集包含了一万个文档,旨在帮助进行基于文本的暗网研究。通过利用 CoDA 数据集,本研究对暗网进行了全面的语言分析,比较了暗网与表层网络之间的差异,并评估了不同方法的暗网文本分类性能。最后,本研究还将 CoDA 与现有数据集进行比较,以评估它们在各种应用场景中的适应性。