选举舞弊的新颖性检测:基于代理模拟数据的案例研究
本论文提出了一种新的方法,通过投票机制结合分类器的不确定度来测量新输入样本的新颖性,并且在 UCF-101 和 HMDB-51 数据集上取得了比最先进的方法更好的结果,在与零样本学习 (ZSL) 相结合的情况下,可以显著提高广义 ZSL 设置下的行动分类准确性。
Oct, 2018
传统上,检测欺诈保险索赔依赖于商业规则和专家判断,这使得过程耗时且昂贵。因此,研究人员一直在研究开发高效准确的分析策略来标记可疑索赔。然而,在开发欺诈检测模型时,我们面临几个挑战,如欺诈的罕见性导致高类别不平衡,只有少数索赔得到调查和标记,导致大量未标记数据,以及公开可用数据的缺乏。因此,我们设计了一个模拟机器,用于创建与实际保险欺诈数据集相似的具有网络结构和可用协变量的合成数据。此模拟引擎使研究人员和从业者可以在各种不同的设置中检验多种方法学挑战以及测试他们的保险欺诈检测模型的(开发策略),同时还可以生成大量的合成数据集以评估(高级)机器学习技术的预测性能。
Aug, 2023
本文针对深度神经网络在检测新颖性或异常性时容易受到输入数据微小变形的问题,提出了一个旨在学习强大的新颖性检测正确性的先验;同时,将该先验与最先进的新颖性检测方法相结合,并评估了该方法在攻击存在与否的情况下的性能表现,得到了较好的结果。
Jun, 2023
本文提出了一种采用多数表决方法检测虚假新闻的方法,使用公开的虚假新闻数据集进行了实验,最终取得了 96.38% 的准确率、96% 的精确度、96% 的召回率和 96% 的 F1 值,实验结果表明多数表决方法比单一学习方法取得了更可接受的结果。
Mar, 2022
通过结合先进的语言模型和详尽的人工验证,我们提出了 FakeWatch ElectionShield,一个创新框架,用于检测假新闻。通过创建新颖的数据集,用于识别与北美选举相关的新闻文章,我们目标是为研究界提供适应性和准确性更强的分类模型,以应对动态的误信息问题。在数据集和基准数据集上对假新闻分类器进行了广泛的评估,结果显示,虽然最先进的语言模型稍微优于传统的机器学习模型,但经典模型在准确性、可解释性和计算效率的平衡方面仍然具有竞争力。这项研究为解决与选举相关的误信息奠定了基础。
Nov, 2023
使用深度半监督异常检测技术 Deep SAD,本研究旨在评估其在高频金融数据中检测欺诈行为的有效性,通过利用蒙特利尔的 TMX 交易所的专有限价订单簿数据和少量真实标记的欺诈实例,我们证明将少量标记数据融入无监督异常检测框架可以极大提高其准确性。
Aug, 2023
本文提出了一种利用生存分析和机器学习的方法,成功地通过随机森林,贝叶斯岭回归和线性支持向量回归分类器,将 PSH Flag 计数、ACK Flag 计数、URG Flag 计数和上行 / 下行比例确定为影响网络流量异常检测的主要特征,并提高了针对未知攻击类型和零日漏洞的 Intrusion Detection Systems 检测性能。
Jan, 2023
该研究提出了使用贝叶斯优化技术来调节支持向量机、随机森林和 k - 最近邻算法参数的异常检测框架,并使用 ISCX 2012 数据集评估了这些算法的性能,结果显示该框架在准确率、精度、误报率和召回率方面具有显著效果。
Aug, 2020
本研究在 52 个实际多元表格数据集上评估 32 种无监督异常检测算法,在收集的数据集中,K-thNN 算法在大多数情况下表现最佳,也确定了两个清晰的簇,一个有 “局部” 数据集,另一个有 “全局” 数据集,考虑到算法的计算复杂性,这三种算法足以找到代表性的多元数据集中的异常。
May, 2023