- 大型语言模型是良好的统计学家吗?
LLMs 在处理复杂统计任务方面存在显著改进空间,引入 StatQA 作为新的基准测试以评估 LLMs 在特定统计任务和应用评估能力方面的表现,并突显 LLMs 和人类在错误类型上的差异,表明结合 LLMs 和人类专业知识有助于相互补充优势 - 可验证的、可复制的和可重现的经验型机器学习研究的设计原则
通过提出一种供应用于实证研究的模型和指南,旨在减少机器学习领域中研究实践的差异性,建立统一的质量标准,提高实证研究的一致性、可靠性和影响力。
- 机器学习和统计分析在语言和认知科学中的不同贡献
本研究利用 Buckeye Speech Corpus,展示了数据驱动研究中机器学习和统计分析的应用,从而获得独特的洞见,显著增进我们对数据驱动策略中不同方法的理解。
- 分子性质预测的 Transformer 方法:过去五年的经验教训
使用变压器模型进行分子属性预测的当前研究进行了分析,强调了尚未涵盖的领域,并提出进行标准化数据划分和稳健统计分析的挑战。
- 自然语言处理竞赛中系统性能分析
合作竞争的科学和技术领域变得越来越受欢迎。本文描述了一种评估方法来对比竞赛结果和竞争。这种方法具有普适性,但是以八个自然语言竞赛为案例进行了说明,涉及分类和回归问题。所提出的方法具有多种优势,包括与修正机制的即插即用比较和置信区间的包含。此 - 使用配对数据进行口腔内 X 射线牙齿异常检测的深度学习算法的统计验证
该研究描述了一个用于检测口腔放射影像中的牙科异常(例如龋齿、根尖病变、根管治疗缺陷、冠冕修复边缘缺陷、牙周骨质流失和牙石)的深度学习算法的临床验证研究设置、统计分析和结果,比较了使用该算法与不使用算法的牙科医生的检测性能,并通过统计学方法证 - 英语字母书写动力学分析
通过对英文字母在不同类别文本中出现频率的统计分析,我们开发了一种称为距离 d 的度量指标,可用于算法识别不同类别的文本,并应用于信息传输、大数据管理和语言学。
- 精准医学中的分析与关注:统计学观点
本文探讨了统计分析在精准医学中的关键作用,着重讨论了个性化医疗如何通过解释复杂的多维数据集来实现,包括预测建模、机器学习算法和数据可视化技术。本文还研究了数据整合和解释方面的挑战,尤其是包括电子健康记录(EHR)和基因组数据在内的多种数据源 - 基于分类模型的面向学习的 DLP 系统
该研究论文提出了一种统计数据泄漏预防模型,利用统计分析、文档分类以及机器学习等方法,采用 TF-IDF(词频 - 逆文档频率)等流行的术语计数 / 权重函数,引入了 IGBCA(改进的梯度提升分类算法)作为一种高效精确的文档分类方法,可防止 - 利用随机投影的马氏距离 DIP 统计量进行多元单峰性检验
通过线性随机投影和点对点距离计算,我们提出了一种根据 α- 单峰假设的多元单峰性测试方法,命名为 mud-pod,通过将一维单峰性原理推广到多维空间中,从而在多维数据集的单峰性评估和聚类数量估计方面表现出良好效果。
- ACL分解仇恨言论:一种研究社交媒体中仇恨言论的新注释框架
我们提出了一种新颖的标注方案,将仇恨言论分为五个独立的话语类别。通过构建包含对犹太人进行仇恨表达的超过 2.9M 条推特帖子的语料库,并对其中的 1,050 条推文进行注释,我们对注释的数据集进行了统计分析,并讨论了注释示例,最后提出了未来 - NESTLE:法律语料统计分析的无代码工具
NESTLE 是一个无代码工具,用于大规模法律语料库的统计分析,其通过搜索引擎、端到端信息抽取系统和大型语言模型为用户提供文档检索、信息提取和数据可视化功能,无需编写任何代码,可以提供定制化的统计分析,提高效率和降低成本。
- 大规模分布式学习中的拟牛顿更新
开发了具有卓越统计分析、计算和通信效率的分布式拟牛顿(DQN)框架,无需 Hessian 矩阵倒置或通信,在小数次迭代下提供了统计效率的结果,强调与现有方法的差别在于对统计学性质的调查。
- 构建无监督异常检测的元学习器
该研究提出了一种新的元学习方法,通过使用从未标记的输入数据集生成的元特征,识别出适当的无监督异常检测算法。该方法的性能优于现有的解决方案,并使用超过 10000 个数据集进行了混合模型统计分析,结果表明相对较少的元特征就足以识别合适的无监督 - 奥尔罕・帕慕克的诺贝尔作品的数学和语言特征描述
通过统计诺贝尔文学奖得主奥尔罕・帕慕克作品的字母和单词数,应用分形几何学方法计算他的文本的分形维度,与 Zipf 定律的应用进行了比较,并用统计分析方法研究其文本结构和土耳其语言的关系。
- EMNLP面向统计法律分析的数据高效端到端信息提取
该研究介绍了一种用于法律文件信息抽取的端到端系统,实验结果表明,该系统可以在少于 50 个训练样本的情况下比基于规则的基线方法得到更好的结果,并且使用 200 个样本可以得到更高的得分,并且使用这个系统从醉酒驾驶和欺诈两个案例类别的 3.5 - 自然语言生成中的自动评估的玻璃天花板
本文对比了现有的自动评估指标和人工评估指标,发现自动评估指标与人工评估指标相比非常相似,并提出了未来评估工作的建议。
- 比较多重插补技术的方法:以美国国家 COVID 队列合作为例的案例研究
本研究提出了一种新的框架,以数字方式评估在统计分析背景下处理缺失数据的策略,特别关注多重插补技术,并在 National COVID Cohort Collaborative 提供的大型 2 型糖尿病患者队列上进行了实证研究,结果显示多重插 - 社交媒体中的仇恨言论打击:一项调查
本文综述了反对仇恨言论生成的最重要研究,重点关注方法学、数据集以及统计分析对社交媒体的影响。
- MMHAPSSA: 使用信号和统计分析的全面 PDF 恶意软件检测方法
本文提出一种全面且简单的基于信号和统计分析的方法,以检测 PDF 恶意软件,采用分别从不同静态和动态恶意软件检测方法中选择的正交特征空间模型进行结合,以实现检测恶意代码混淆的鲁棒性。使用近 3 万个 PDF 文件数据集,我们证明该方法保持高