- 关于以求和运算符进行概率和因果推理
引入求和运算符来捕捉应用程序中常见的设备,如 Pearl(2009)的因果推断中的 $do$-calculus,其中大量使用边际化。我们对使用边际化的概率和因果推理的复杂性进行了完全的特征化,证明了它们仍然等同困难。
- 挑战冠军比赛中行贿的参数化分析
对于初始冠军的竞争中,玩家可以通过贿赂降低胜率,研究目标是通过贿赂其他玩家来最大化初始冠军赢得比赛的概率,而不超过给定的贿赂预算。通过研究该问题的复杂性,我们发现通过玩家数量参数化时该问题是弱 NP 难问题和 W [1]-hard 问题。此 - 可微分编程的要素
通过大规模模型、海量数据集、加速硬件和可微分编程的变革力量,人工智能最近取得了显著进展。不仅可以以端到端的方式对复杂计算机程序进行微分,还可以优化程序参数。可微分编程建立在自动微分、图模型、优化和统计学等多个计算机科学和应用数学领域的基础上 - 通过双阶段干扰测试的必要性和充分性特征归因方法对因果解释
机器学习中解释性问题的研究,通过特征归因方法(FAMs)测量每个特征的贡献,提出利用概率作为特征重要性的度量,通过 Necessity and Sufficiency(FANS)方法进行特征归因,最终与梯度优化相结合提取重要子集,在六个基准 - $C^*$ 代数机器学习:迈向新方向
机器学习与数学领域诸如统计学、概率论和线性代数等有着长期的合作传统。我们提出了机器学习研究的新方向:$C^*$- 代数机器学习。这是 $C^*$- 代数与机器学习的交叉授粉。$C^*$- 代数数学概念是复数空间的自然推广,它能够统一现有的学 - 通过可分离性优化神经 ODE 的分类
在这项研究中,我们提出了一种基于神经常微分方程(neural ODEs)的分类方法,通过考察单个隐藏层中每个神经元用于实现任务所需的数量,特别是当数据点在单位正方形中独立均匀分布时。我们的分析提供了一种量化少于 O (N) 个神经元所需概率 - 学生学习中技能分类和预测的概率和信息熵差异
使用贝叶斯定理、概率补、学习事件的概率差异,来预测学习对象在学生学习中的应用;文章通过计算过程演示了技能集事件概率、未发生事件概率、决策树的准确性和技能集数据的信息熵对学生认知表现和学习建议的影响。
- 自回归之火:通过它们所训练解决的问题来理解大型语言模型
大语言模型的广泛应用使得识别它们的优势和局限性变得重要。我们主张,为了全面理解这些系统,我们需要考虑它们在训练中解决的问题:互联网文本的下一个词预测。通过认识到这个任务所带来的压力,我们可以对大语言模型采用的策略进行预测,从而推断它们的成功 - 基于 Transformer 语言模型和 n-gram 困惑度的文本向量化
该研究提出了一种基于 n-gram 困惑度计算的向量值算法,以替代仅有一个困惑度值的标量困惑度,该算法考虑了概率、困惑度、文本、标记等方面,并将这些值合并为表示输入的单个向量。
- ACL你需要在可能的 tokenization 上做边缘化吗?
本文研究自回归语言模型中计算字符序列概率的方法,提出了一种基于重要性采样的算法估计边缘概率,并在一系列尖端模型和数据集上进行比较,结果表明在大多数情况下,对边缘化的忽略导致的对数似然差异小于 0.5%,但对于长且复杂的数据则更加明显。
- 2043 年前实现具有变革性的 AGI 概率小于 1%
应用级联条件概率方法,本文估计了到 2043 年转化性人工智能(AGI)的可能性低于 1%,这估计是由软件、硬件和社会政治因素等多个因素的联合概率计算而成的。
- 利用假设性回溯进行不确定的机器伦理决策
提出使用回溯论证程序来改进现有的机器伦理推理方法,该程序可以考虑人类哲学视角下的概率和不确定性,同时允许伦理学中的各种哲学理论被使用,实现了自主图书馆系统下的后果主义和义务论伦理理论的并行运行,并引入了一个初步框架,具有多重理论下的灵活性以 - 基于不确定性启发的开放集学习用于视网膜异常识别
本研究提出了一个基于不确定性的开放集模型,可用于正确识别视网膜异常,该模型还可以计算不确定性得分以表达其自信度。使用阈值策略的 UIOS 模型在三个测试集上的 F1 得分分别为 99.55%,97.01%和 91.91%,比标准 AI 模型 - 一种跟踪多知识概念掌握概率的概率生成模型
我们提出了一种名为 TRACED 的模型,借助基于 markov chain 的 knowledge tracing 来跟踪学生各项知识点的理解概率,通过 LSTM 解决了 explanatory away 问题,同时采用了一个新的三元交互 - MM从图的生成到图的分类
本文介绍了一种利用图生成模型 (GGM) 进行图分类的新方法。假设 GGM 定义了一个联合概率分布,可以得出给定图的类标签的分类公式,并使用新的条件 ELBO 训练生成式图自编码器模型进行辨别。虽然在非关系 i.i.d. 数据的分类中已经使 - 乌兹别克语停用词检测精度:以 “学校语料库” 为例的案例研究
本文介绍了一种用于评估停用词列表质量的方法,以自动创建技术。该方法在乌兹别克语的自动生成停用词列表上进行了测试,可以应用于相似语言。
- 在不确定性下结合预测:随机决策树的案例
本研究探讨了多个概率预测方法,包括基于信任函数和可靠分类的方法以及我们称之为证据累加的原则。实验结果表明证据累加的效果优于投票和取平均值的方法,特别是在中等规模的叶子节点上。
- 三值条件语句中的确定性推理和不确定性推理
本文通过三价真值方法来提供一种条件推理的逻辑解释并运用逻辑情景下的几率来对条件状语句进行分类。
- 带标签的分布式转移系统用于隐私分析
DLTTS 是一个逻辑框架,它形式化地模拟了一个给定的数据库,如何通过代理 / 对手反复查询数据库。
- 混合非确定性 - 概率自动机:将图形概率模型与非确定性融合
本文提出了一个新的模型混合自动机(非确定性 / 概率性),它不仅包括了非确定性自动机,还包括了图形化概率模型,并且它配备了与图形化概率模型继承的并行组合、模拟关系和支持消息传递算法。Segala 的概率自动机可以映射到混合自动机。