strategies | BriefGPT - AI 论文速递

关键词strategies

搜索结果 - 22

蜘蛛式策略发现和调度构建中的正则化
对 Vampire 证明器的策略进行发现和构建过程的大规模实验，讨论了得到强大的 Vampire 计划的难易程度以及计划的泛化性和影响因素。
PDF3 months ago
基于程序的策略归纳强化学习
使用贝叶斯规划归纳发现对称学习、适应性依赖于时间跨度的随机探索和离散状态转换等在经典的增量学习中困难或出乎意料的策略。
PDF4 months ago
AAAI信念策略的逻辑
在很多现实世界的情况中，我们通常不具备足够的信息来确定某种策略是否能够成功实现目标，但有充分理由相信它会成功。本文引入了 “doxastic” 这一术语来描述这种策略，主要的技术贡献是一个完备的逻辑系统，描述了 doxastic 策略和信念
PDF7 months ago
MM修复深度神经网络的问题需要更好的训练数据和学习算法
DNNs 对生物视觉的模拟能力不佳，因其依靠与人类截然不同的策略实现与人类准确度相匹敌的结果。随着 DNNs 规模的增大与准确度的提高，这一问题变得更加严重。本研究提出了一种可靠地模拟生物视觉的 DNN 构建方法。
PDF9 months ago
降低风险设计与运营工具包：在决策问题中管理风险与不确定性的 90 种策略
该论文提出了一种被忽视的应对不确定性的策略类别 ——RDOT（风险降低设计和运营工具包），该工具包可以应用于受到高度不确定性影响的决策问题，使其变得更容易处理。论文总结了 90 多种 RDOT 策略，并提出了一个将其纳入多目标优化的决策模型
PDF10 months ago
人机交互中的信任修复再思考
研究旨在发现设计具备信任修复能力的机器人策略和探索成功的潜在机制，以实现对机器人信任违背的修复。该文概述了人机交互中信任修复过程的基本概念和关键组成部分，并总结了作者在该领域的发表工作。此外，还讨论了将指导未来工作的研究问题以及该研究对该领
PDFa year ago
机器学习软件系统中的质量问题
本文旨在从实践者的角度研究机器学习软件系统中的质量问题，通过一系列采访和调研，我们创建了一个包含 18 个质量问题和 24 个解决策略的目录，这将有助于开发高效的质量保证工具。
PDFa year ago
机器学习模型误差的注意规则自动生成
本研究提出使用基于特征分片的算法来帮助机器学习模型的诊断和优化，使用 TOPSIS 方法来评估不同策略的绩效、稳定性和泛化能力。
PDFa year ago
人工智能中的公平以及对社会的长期影响
本文讨论了在人工智能中缺乏公平性可能导致偏见加深和社会压力的问题，评估了当前改善 AI 公平性的策略并探索了未来的潜在路径。
PDFa year ago
微调预训练模型的稳定性分析
通过理论稳定性分析和提出的新策略，解决预训练模型微调在同样设置下性能稳定性差异问题。
PDFa year ago
AI 是否能够为 REF 输出分配质量分数？实验证据
利用人工智能预测期刊文章得分的五种策略进行了评估。
PDF2 years ago
ACL亚里士多德是否使用过笔记本电脑？具有隐式推理策略的问答基准测试
本研究提出了一个策略问答（QA）基准，其中隐含着应该使用一种策略来推理出问题的答案，包括一个包含 2,780 个示例的数据集，该数据集使用词语引导的数据收集方式以激发众包工人，控制注释器群体和通过构建对抗过滤器消除推理快捷方式来实现。分析结
PDF3 years ago
复杂网络中的级联故障
对于流行复杂网络中的级联故障现象，本文基于物理及复杂网络科学的研究方法，探讨了其机理、动态及影响，并提出了阻断故障扩散的新策略。
PDF4 years ago
真实世界的游戏看起来像陀螺
本文研究现实世界游戏（如井字棋，围棋，星际争霸 II）的几何特性并证明它们与竞技场上的旋转体结构相似。此结构形成的不对称性带来了关于学习与策略的问题，我们用 9 个现实世界两人零和对称游戏进行了实证。
PDF4 years ago
通过交替梯度下降上升实现固定步长的有限遗憾和循环
本文介绍了一种通过交替更新策略，使用有限步长实现梯度下降算法的非标准实现方法，从而消除了标准实现方法容易出现的策略偏离均衡和后悔值不断增加的问题，并建议在对抗环境下使用交替梯度下降算法来保证策略的有界性和周期性。
PDF5 years ago
有限深度求解不完全信息博弈
该篇论文提出了一种通过让对手在深度限制处选择多个策略之一来在不完美信息游戏中进行有原则的深度限制求解的方法，证明了这种方法的有效性，并建立了一个仅使用 4 核 CPU 和 16GB 内存就可以击败之前的两个顶级代理的大师级德州扑克 AI。
PDF6 years ago
梯度下降优化算法综述
本文探讨了不同变量的梯度下降，总结了挑战，介绍了最常见的优化算法以及并行和分布式设置中的结构，并研究了优化梯度下降的附加策略。
PDF8 years ago
MM不可预测领域谈判团队通用的一致接受协议
文章研究了对需要团队决策一致的情况下的团队决策制定，并基于贝叶斯学习来提供团队成员的决策策略。实验结果表明，如果团队成员使用贝叶斯学习来建立对队友的了解，则团队的决策效果会得到提高。
PDF8 years ago
马尔可夫决策过程中多重平均回报目标的统一视角
本文研究具有多个极限平均（或均值支付）目标的马尔可夫决策过程，囊括了优化期望和满足约束的两种语义，并考虑到具有风险规避策略的优化问题。文章的主要结果包括：多项式时间的算法、多项式大小的 Pareto 曲线近似计算和策略复杂性的完整刻画。
PDF9 years ago
随机最短路径问题的变体
本文介绍了关于随机最短路径问题的算法和策略，提供多种保证路径长度分布，而不仅是期望值最小的解决方案，并对最近在马尔科夫决策过程的研究成果进行了应用。
PDF10 years ago