- ICML多目标强化学习的最大最小公式:从理论到无模型算法
本文研究多目标强化学习在应对多个优化目标的实际问题中的应用,采用最大最小框架从公平的角度出发并在该框架下提出了相关理论和实用的无模型算法。所提出的理论在多目标强化学习方面具有理论上的突破,而所提出的算法在性能上显著优于现有的基准方法。
- 使用 Posets 进行机器学习和数据分析的综述
对使用 posets 进行数据分析和机器学习的广泛研究进行了综合回顾,并且重点讨论了应用格理论领域 —— 形式概念分析在机器学习中的应用。
- 移植:使随机森林一致
本文探讨了将一致性估算器嫁接到浅层 CART 中的适用性,证明了该方法在理论上具有一致性保证并在实证研究中表现良好。
- Transformer 模型的数学视角
该研究通过将 Transformers 解释为相互作用的粒子系统,提供了一种数学框架,揭示了长时间内聚集体的出现,并探索了相关的理论,为数学家和计算机科学家提供了新的视角。
- 顺序归纳预测区间
通过使用来自顺序测试理论的观点,本文探索了顺序归纳预测区间的概念,并引入了一个 3 参数 PAC 定义的预测区间,通过模拟实现几乎确定性的边界。
- 智能理论:概念、模型、影响
智能是一种人类构造的概念,代表实现目标的能力。该论文旨在通过理论和定量分析,讨论智能的中心要素、挑战并提出一种基于第一原则的理论。关键特征包括路径效率、目标准确性等,并提出一种首次原则的智能理论框架 (TIS)。
- 自动度量文本生成系统有效性研究
本篇论文提出了一种新的理论方法,用以评估文本生成模型的可靠性与鲁棒性,并在 WMT 21 和 Spot-The-Bot 数据上进行了应用与验证,并实现了对样本量的有效估算。
- 安全强化学习综述:方法、理论与应用
该论文从方法、理论和应用的角度回顾了安全强化学习的进展,提出了 “2H3W” 问题并分析了解决这些问题的理论和算法进展;还讨论了安全强化学习方法的样本复杂度,并介绍了相关应用和基准,最后开启了安全强化学习中的挑战问题的讨论并发布了一个包含主 - DynLight:多层次信号控制实现动态相位时长
因语言和理论描述存在不足,作者引文修订与更新,故撤回本文。
- 强化学习教材
本教科书涵盖了现代深度强化学习算法所依据的原则,这些算法在许多领域中取得了突破性成果,从游戏人工智能到机器人技术。所有必要的理论均使用统一的符号进行解释并进行证明,强调了不同类型算法之间的区别以及它们构建方式的原因。
- WWW遗憾最小化代理人之间的拍卖
本文研究一种情景,软件代理机器人实施后悔最小算法,代表他们的用户进行重复拍卖。研究一价和二价拍卖及其广义版本。使用理论分析和模拟,结果表明在二价拍卖中,玩家有激励向其自己的学习代理机器人提供不真实的估值,而在一价拍卖中,对于所有玩家真实报告 - 从超参数化机器学习理论的角度看偏差 - 方差折中问题的再思考
本文概述了 “过参数化机器学习” 的新理论,通过统计信号处理的角度解释最近研究发现的相应现象和结果,着重强调了这个研究领域的独特性和开放的问题。
- ICML最优连续学习具有完美记忆且是 NP 难问题
本文提出了一个理论方法来解释在连续学习任务中避免遗忘的可行性和困难性,主要发现是实现这样的算法通常需要解决 NP 问题和具有完美的内存存储能力。此发现在经验回放、情景记忆和核心集等方面的 CL 算法表现出的优异表现相对于基于正则化方法是有理 - 生成对抗网络综述:算法、理论和应用
本文从算法、理论和应用三个方面综述了各种生成对抗网络(GANs)算法的动机、数学表示和结构特点,比较了不同 GANs 方法的共同性和差异,探讨了 GANs 相关的理论问题以及在图像处理、自然语言处理、医疗领域、数据科学等领域的应用,并指出了 - ACL顺序神经网络作为自动机
本研究试图从理论的角度解释神经网络的计算类型,通过将它们与自动机相关联,并使用定义 “实时网络有界精度接受语言” 的方法来解释网络内存度量,对可被各种循环网络、注意力和卷积网络接受的语言类别进行了表征。研究发现 LSTM 功能类似于计数器机 - 量子退火的视角:方法和实现
这篇论文介绍了量子退火作为一种计算范式的概念,探讨了量子计算面临的挑战和潜在解决方案,并强调实验和理论之间的协同作用,着重讨论了未来的发展方向和意义。
- 探索学习表示:不同神经网络学习相同表示的程度
本研究通过理论和算法对同一结构但训练自不同初始化的两个深度神经网络学习出的神经元激活子空间匹配进行研究,提出了最大匹配和简单匹配的核心概念,并发现了在子空间匹配方面,从不同初始化训练的网络中学习出的卷积层表示并不像普遍预期的那样相似。
- 深度学习中的泛化错误
本文概述了现有理论和界限,以表征深度神经网络的泛化误差。
- 多项式优化问题中的最优潮流
用多项式优化问题表达交流最优电力流(ACOPF)问题可以在实践中解决大规模实例,并在理论上保证渐近收敛。
- MM答案集编程与其他计算范式会议论文集(ASPOCP2013),第六届国际研讨会,2013 年 8 月 25 日,土耳其伊斯坦布尔
该论文是第六届 ASPOCP 2013 会议上提交的论文,主要讨论了当前 ASP 技术在理论、求解和应用方面与其他计算范式的交叉和融合的讨论。