- MMHAPSSA: 使用信号和统计分析的全面 PDF 恶意软件检测方法
本文提出一种全面且简单的基于信号和统计分析的方法,以检测 PDF 恶意软件,采用分别从不同静态和动态恶意软件检测方法中选择的正交特征空间模型进行结合,以实现检测恶意代码混淆的鲁棒性。使用近 3 万个 PDF 文件数据集,我们证明该方法保持高 - MM视频中人声检测
本文提出了一种通过利用神经网络提取面部标志,并对这些标志进行时间统计分析以检测视频中的发言者的新方法。
- KDD21 世纪重大疾病爆发建模:因果方法
通过统计分析和数据填补技术,我们发现全球发展指标与疾病爆发之间的因果关系,同时识别出最重要的与疾病爆发相关的发展领域。
- 神经网络视角下的输入相似度
本研究介绍了一个多模式图像配准任务,并使用训练有素的神经网络来实现自动去噪,通过在相似输入示例的标签上进行的噪声平均效应来解释这一现象,并提出了相似度度量的定义和估计方法以进行新型的神经网络统计分析。
- ACL如何评估摘要生成器:手动语言质量评估的研究设计和统计分析
通过对最近总结系统论文的调查,我们发现,在如何进行这样的评估研究方面存在很少的一致性。我们进行了两个评估实验来比较 Likert 类型和排名注释,并展示了评估方法的最佳选择可能因一个方面与另一个方面不同。使用我们的评估实验,我们展示了注释者 - 受损 CPS 设备的系统行为检测框架:智能电网案例
本文提出了一种新的可配置的系统级框架,利用系统和函数调用跟踪技术、信号处理和统计分析,基于行为特征检测受损的智能电网设备,对六种不同类型的受损设备进行了测试,并且在不同攻击场景下表现出良好的检测精度和最小的计算资源开销。
- EMNLP分组、提取和聚合:为外汇运动预测总结大量金融新闻
本研究提出了一种基于 BERT 的分层聚合模型,通过最先进的抽取式摘要方法,从大量的金融新闻中提取最关键的新闻,并与交易数据相互作用来预测外汇市场的动向。实验结果表明,类别为基础的方法在三种分组方法中表现最佳,并在所有基线模型中表现最优。此 - 量化机器学习研究的独立再现性的一步
本研究通过手动尝试实现 1984 年至 2017 年发表的 255 篇文章,记录每篇文章的特征,并对结果进行统计分析,首次尝试寻找可量化的答案,证明代码发布不足以决定文章实现的可复制性。
- TequilaGAN: 如何轻松鉴别 GAN 样本
本文介绍了基于统计分析和数据特征提取以及学习真实数据形式规范的方法来识别利用生成对抗网络生成的虚假样本,并且发现这种虚假样本有一个可用于鉴别的普遍特征,最终在 MNIST、CIFAR10、音乐和语音数据上进行了实验验证。
- StegNet: 深度卷积网络实现的超大图像隐写容量
本文运用深度卷积神经网络和图像隐写术,将安全地嵌入隐藏信息的传统图像隐写术与图像 - 图像隐写术相结合,并成功地将具有巨大负载容量的图像进行隐藏,同时仍然对统计分析具有鲁棒性,通过最小化图像覆盖变化的方法,实现 98.2% 的解码率或 23 - NIPS机器学习方法在交通量预测中的应用:以摩洛哥高速公路网络为例
本研究旨在探讨用于摩洛哥高速公路交通预测的不同方法,包括统计分析和机器学习,该研究采用多种算法,如随机森林、人工神经网络和长短时记忆神经网络等,并开展了数据整理和深入理解交通行为的贝塔模型。
- 实用统计学
讨论在高能物理分析中出现的统计问题,重要的是要投入大量的人力和资金来进行好的数据统计分析,以提取出最佳信息。
- MMDice CAPTCHA 可用性的统计分析
本文通过对一个特定 Dice CAPTCHA 类型的用户研究,分析了 CAPTCHA 的实用性元素,重点是用户中心的方法,收集不同人口统计特征的 190 位用户数据,并进行统计分析。研究结果表明,该类 CAPTCHA 具有较高的实用性。
- 草图算法的统计性质
该论文介绍了一种称为 “sketching” 的数据压缩技术,该技术通过随机投影将大型数据集压缩成较小的替代数据集,然后进行统计分析,该方法特别适用于大规模的线性回归问题。
- 使用混合多摄像头方法在拥挤与室外场景中进行人数统计
本研究提出两种新方法用于在拥挤和开放环境下进行人群计数,利用多个视图收集的信息,结合使用多个相机。多个相机用于扩大视野并缓解单个相机计数方法常常受到的遮挡的问题。两种方法都能够统计场景中人员的数量而不仅仅是单帧图像或视频帧。在基准 PETS - 多人在线竞技场中的玩家技能分解
通过使用不同的技能预测模型,该研究分解了 MOBA 游戏玩家技能并将其影响以统计术语评估,发现在 LOL 中,游戏人物的基本技能、玩家的基本技能和玩家特定的技能是影响赛果的三个主要技能组成部分,而 DOTA2 的赛果主要受游戏角色的基本技能 - 严格鞍点问题的经验风险最小化的快速速率
本文研究非凸风险最小化的样本复杂性,并探索了在此上下文中最小化此类功能的有效算法,结果表明这些算法不仅具有统计稳定性,而且具有良好的泛化能力。
- CVPR拓扑持久图统计分析的黎曼框架
本文提出了一种新的基于黎曼几何的持久图远程度量方法,将持久图建模为在希尔伯特球上以平方根框架表示的 2D 概率密度函数,避免与点进行一一对应比较,优化了计算复杂度,并可运用差分几何进行持久图的统计学分析。
- 移动手机步态验证中传感器方向不稳定性问题
该论文主要针对移动设备中的难点 - 传感器方向的不稳定性提出了解决方案并提出了一种基于统计分析和监督学习的新型步态识别方法,使用 PCA+SVM 构建步态模型,取得了优异的表现。
- 大一新生还是新生?量化互联网语言的地理变化
该研究介绍了一种新的计算技术,用于检测和分析语言中的地理变异,并使用统计学方法识别特定于地区的显著差异。通过神经语言模型学习单词表示,以捕捉地理区域内的不同语义,该方法是第一种明确考虑偶然变异的方法,同时检测单词含义区域变异。研究使用两个大