- 演化算法评估 Connect-4 中高级 Minimax、Q-Learning 和 MCTS 的比较框架
在大状态空间的决策领域中,有效选择最大效用的行动是一个主要挑战。本文针对一个游戏领域 ——Connect-4,开发了一种新颖的进化框架来评估三类算法:强化学习(RL)、极大极小算法(Minimax)和蒙特卡洛树搜索(MCTS)。研究发现,M - 5*5 多人围棋的深度强化学习
使用搜索算法和深度强化学习,本文提出并分析了使用 AlphaZero 和 Descent 算法自动学习多人版围棋。进一步展示了搜索算法和深度强化学习提高了棋局水平的结果。
- 基于 Transformer 的观察空间规划及其在扑克牌游戏中的应用
GO-MCTS 是一种利用代理观察生成序列进行搜索的广义观察蒙特卡洛树搜索方法,通过基于种群的自我对弈迭代训练 transformer 模型,有效解决了在不完全信息游戏中搜索算法的局限性。
- 研究涉及搜索和重新搜索
深度优先策略、最佳优先策略、极小化极大游戏、AB 算法是本研究的主要关键词,该研究结论指出最佳优先策略并不比深度优先搜索更高效。
- 本地顶点着色图神经网络
最近几年来,有大量的研究专注于扩展图神经网络(GNNs)的表达能力,超越 Weisfeiler-Lehman (1-WL) 框架。在这项研究中,我们从图搜索的角度探讨了 GNNs 的表达能力,提出了一种新的顶点着色方案,并证明经典的搜索算法 - 探索内容:对搜索驱动的视频游戏程序化内容生成的调查
视频游戏需求不断增长,需大量内容的昂贵制作。研究人员开发了基于搜索的程式化内容生成(SBPCG),即通过搜索算法进行(半)自动化创作内容。我们调查了现有 SBPCG 的状况,报告了 2011 年至 2022 年该领域出现的工作,并确定了开放 - 基于机器人协议的网页爬虫策略
介绍了搜索引擎如何使用搜索算法,通过网络爬虫获取网页并提供方便的搜索结果,以及 webmaster 如何使用机器人排除协议以限制网络爬虫的访问。
- ICML加权因果有向无环图的新度量和搜索算法
通过研究自适应干预下的因果图发现,提出了一种新的基准,捕捉任何搜索算法的最坏干预成本,并提出了在各种设置下实现对数逼近的自适应搜索算法。
- 受迭代加深搜索启发的增益调度奖励奖励
本文介绍了一种新颖的方法,在任务导向的奖励函数中添加内在的奖励以有效促进强化学习搜索,并设计了两种奖励和启发式增益调度,可以使智能体逐渐探索未知状态,并在三个运动任务和三个简单任务中展示了两种奖励的协同作用,以及正确认识地结合它们与所提出的 - 使用功能化面向对象网络进行知识检索
本文描述了一种用于机器人任务的知识表示模型 FOON,定义了其结构和主要组件,并介绍了创建通用 FOON 数据集的过程。同时,讨论了在 FOON 中使用的各种搜索算法和启发式函数以及它们的效果。
- 利用知识检索搜索算法在功能面向对象网络中提取任务树
本文介绍了用于机器人任务规划的功能面向对象网络 (FOON) 及其在提取任务树过程中使用的迭代加深搜索 (IDS) 和贪心最佳优先搜索 (GBFS) 算法在不同烹饪食谱中的表现比较。初步结果表明,根据所提供的配方,每种算法都可能比另一种更好 - 使用功能对象导向网络的机器人烹饪任务树检索算法
论文使用功能面向对象网络,实现了三种搜索算法,为给定目标节点生成任务树,论文详细介绍了该方法、过程和结果。
- 机器烹饪知识检索
本文主要介绍了针对机器人执行任务时需要的数据检索和算法设计,提出了一些加权功能对象网络和任务规划算法,能够使机器人和人类成功地共同完成比人类单独完成更复杂的任务。
- CVPR从实际角度揭秘神经切向核:在不进行训练的情况下,它是否可供神经架构搜索信赖?
本研究提出了基于 Label-Gradient Alignment(LGA)的新型 NTK 度量方法,通过少量训练,LGA 能够可靠且准确地估计神经结构的性能,并能指导现有的搜索算法以更小的搜索成本实现具有竞争性的搜索性能。
- 培养一位成功的炸弹超人代理
本文研究了基于不同搜索算法(蒙特卡罗树搜索、滚动视野进化和 Beam 搜索)的 AI 策略,以成功玩出 CodinGame 平台上的 Bomberman 变体游戏,并提出各种强化方法。我们的最高水平变异体基于 Beam 搜索,并实现了在状态 - EMNLP挖掘神经机器翻译中的错误:从部分假设空间评估和理解模型错误
本研究提出了一种新的神经机器翻译 (NMT) 模型评估协议,该协议基于模型的排名能力定义模型错误,并提出了两种近似方法,以应对指数级的假设空间,并将其应用于各种 NMT 基准和模型架构,揭示了模型的排名问题,评估模型错误与搜索算法的相关性。
- 使用反向传播学习增强策略的更快自动增强
本文提出了一种可微分的策略搜索方法,用于数据增强,该方法比之前的方法更快,使用的是离散参数变换的近似梯度和可分辨操作选择机制。我们的方法通过最小化增强数据与原始数据之间的分布距离来优化,比之前的工作实现了显著更快的搜索,而不会出现性能下降。
- 面向模块化和可编程化的架构搜索
本文提出一种编码通用计算图上的搜索空间的正式语言,解决了目前基于深度学习架构搜索的特定应用和通用超参数优化系统之间的折衷问题。该语言的结构使我们能够编写模块化、可组合和可重用的搜索空间,并在不同搜索空间和优化算法的组合中自由实验,而不必从头 - 高效搜索多样一致的解释
本篇论文提出了使用混合整数规划来进行反事实解释的新型搜索算法,在处理具有连续范围或离散状态集的复杂数据时,使用了一组新颖的约束条件,称为混合多面体,可以有效地找到连贯的反事实解释。同时,本文还探讨了多样性解释的问题,并展示了如何在我们的框架 - AAAI对抗实时游戏中多元控制的非对称动作抽象
本文介绍了一种称为不对称抽象的行动抽象方案的搜索算法,使得搜索算法能够在大规模游戏中导出有效的策略,并在实时策略游戏中的战斗场景上获得显著的优越性。