- 逆散度上的无偏估计方程及其条件
本文研究了由互补函数定义的 Bregman 距离,即逆向距离。探讨了通过单调递增函数和逆向距离定义的损失函数下,使估计方程无偏的统计模型和函数 f 的条件。具体而言,我们通过逆高斯型和广义逆高斯型分布的混合模型表明,对于每个模型,函数 f - 关于元提示
使用类别论的理论框架来描述和推广统计模型中的元提示方法,研究发现元提示方法在创意和构思领域的应用比基本提示方法更有效。
- rTisane: 将数据分析的概念模型外部化,提高与领域知识的互动,并改进统计模型质量
统计模型应准确反映分析师关于变量及其关系的领域知识,本文通过一个实证研究和控制性评估,提出了 rTisane,一个用于表达概念模型的领域专用语言(DSL),帮助分析师更深入地参与和准确地表达他们的假设,从而获得符合分析意图并更好适应数据的统 - 企业信用评级调查
公司信用评级在当代经济和社会发展中起着非常重要的作用。这篇论文通过对国内外相关文献的阅读和研究,系统梳理了公司信用评级的发展背景,并从统计模型、机器学习模型和神经网络模型三个层面总结了常见的评级数据库,深入比较了不同模型的优缺点。最后,本文 - NOWJ1@ALQAC 2023:利用经典统计模型和预训练语言模型提升法律任务性能
该论文提出了 NOWJ1 团队在 2023 年自动法律问答竞赛中的方法,通过整合经典统计模型和预训练语言模型来提高法律任务性能。该方法使用了预处理步骤以克服输入的限制,并应用学习排序方法来整合来自不同模型的特征。问答任务被分为两个子任务:句 - HurriCast: 利用机器学习与统计建模的 自动框架进行飓风预测
本研究通过结合 ARIMA 模型和 K-MEANS 的方法,以及利用 Autoencoder 进行增强的模拟,有效地模拟了历史飓风行为并提供了潜在未来轨迹和强度的详细预测,为风险管理策略提供了可行的见解。
- 可视验证与可视估计:散点图中的平均值研究
本研究探讨了个体用视觉方式验证统计模型与数据拟合的能力。通过对两个不同群体(众包参与者和志愿者)的研究,发现被接受为有效模型的准确度较估计模型低,并且参与者的验证和估计是无偏的。此外,发现他们在接受和拒绝给定均值时的临界点接近其 95% 置 - 智能警报生成的混合方法
本文提出了一种混合模型用于警报系统,该模型将统计模型与白名单机制相结合,以解决大规模网络系统中可伸缩性、数据异构性、可泛化性和可维护性的挑战,从而减少假阳性警报。
- 基于统计学和机器学习模型的实时日常排放比较研究
本文选用六种模型(灰色预测模型、ARIMA 模型、SARIMAX 模型、人工神经网络模型、随机森林模型和长短时记忆模型)对中国所有部门(电力、工业、地面交通、住宅、国内航空、国际航空)在 2020 年 1 月 1 日至 2022 年 9 月 - 基于机器翻译的阿拉伯方言自动标准化
利用人工注释语料库对电视剧马拉雅 2013 进行研究,探讨将不同阿拉伯方言通过机器翻译自动转化为标准阿拉伯语的问题,提出了基于统计模型的自动标准化方法,并将其与机器翻译软件结合,可进行教育应用,如将方言文本转化为标准阿拉伯语进行理解。
- MM利用二阶信息提高统计模型的计算复杂度
通过使用二阶信息的标准化梯度下降法(NormGD)来解决参数估计问题,可以在样本量 n 的对数数量级内收敛,从而实现了达到最终统计半径的最优总体计算复杂度 O (n)。
- ACL关系抽取文档覆盖率预测
该论文介绍了一种新的任务,即预测文本文档的覆盖范围,以进行关系抽取和知识库构建,并提出了一种结合特征和 BERT 的模型,可以有效地预测覆盖范围和拒绝索赔。
- MM一种基于混合模型和学习的方法,用于利用有限数量的训练样本进行分类
提出了一种混合分类方法 HyPhyLearn,结合物理统计模型和学习分类器,通过神经网络的领域对抗训练来减轻分类任务中所面临的挑战。
- 基于时间序列分析的股票价格预测:机器学习和深度学习模型
本研究利用统计学、机器学习和深度学习模型建立了一个强大而准确的股票价格预测框架,研究结果表明该多模型的结合方法可以从波动和随机的股票价格数据中有效地学习。
- ACL学习去噪远程标记数据,用于实体类型划分
这项研究提出了一种使用两阶段过程来处理有噪音的远程标记数据的方法,包括滤波和修复嘈杂标签的模型,可以用于超细实体类型任务,具有比原始的远程数据或启发式去噪远程数据表现更好的性能。
- 众包质量控制的统计建模和设计方法技术调研
本文介绍了众包质量控制中机制设计和统计模型两大分支的研究和应用,提出了系统化统一机制以确定响应质量的框架,并对质量控制论文进行了分类,并指出了当前的限制和未来的方向。
- MS-ASL:用于理解美国手语的大规模数据集和基准
本文提出了一个包括 25,000 个有注释视频的美国手语数据集,通过 I3D 架构的应用,实现了对 1000 个手势的无限制语境下的识别。
- 非凸优化遇见低秩矩阵分解:概述
本文从统计模型的角度出发,系统地讨论低秩矩阵分解非凸优化的可靠解法,总结出了两种方法:1. 根据问题特征设计初始值,进行迭代求解;2. 利用全局凸性分析,无需初始值,直接求解。文章阐述了这些方法在各种场景下的应用并剖析了其理论基础。
- NIPS论 GAN 和 GMM
本文研究了 GANs 在图像统计建模方面与 Gaussian 混合模型的效果,结果表明,GMM 能够生成逼真的图像,同时也能够捕捉到 Gans 无法捕捉到的分布特征,为图像生成提供了一种有效而全面的统计学方法。
- 不同类型噪音对神经机器翻译的影响
本文探讨了并行训练数据中各种类型的噪声对神经机器翻译系统性能的影响,通过创造并分析五种人造噪声的方式来研究神经机器翻译和统计机器翻译的性能下降,发现神经模型通常比统计模型更容易受到噪声的影响。