- 结合超参数自动优化和奖励形状
深度强化学习在过去几年取得了显著进展,但是即使对于专家来说,找到适当的超参数配置和奖励函数仍然具有挑战性并且性能严重依赖于这些设计选择,因此我们提出了一种方法来同时优化超参数和奖励函数,实验证明综合优化可以显著改善性能,在一些环境中比基准性 - 走向图对比学习:调查和进展
在图数据上的深度学习、自监督学习、图对比学习和以数据为基础的图学习的实际应用是这篇综述的主要内容。
- 动态 NeRF:综述
Neural Radiance Field 是一种新颖的隐式方法,用于高分辨率的三维重建和表示;动态 NeRF 是更实际和实用的研究方向,具有更多潜力。
- 使用 LLM 的相似数据点识别:一种利用摘要和隐藏状态洞察的带人工干预策略
本研究提出了一种简单而有效的方法,利用大语言模型(LLM)在非自由文领域(如表格和图像数据)中识别相似数据点。我们的两步方法涉及数据点摘要和隐藏状态提取。首先,通过使用 LLM 进行摘要,将数据压缩,降低复杂性并突出句子中的关键信息。随后, - 大型语言模型的概念与实施调查
基于 Transformer 架构的大型语言模型(LLMs)的近期进展在自然语言处理(NLP)应用领域展示了显著的拓宽范围,超越了其在聊天机器人技术中的初始应用。本文探究了这些模型的多方面应用,重点关注 GPT 系列,对人工智能(AI)驱动 - Uni-SMART: 通用科学多模态分析与研究变换器
Uni-SMART 是一种创新模型,旨在深入理解多模式科学文献,通过量化评估在多个领域展示了超越文本焦点的大型语言模型的卓越性能,同时探索了专利侵权检测和图表的细致分析等实际应用,凸显了 Uni-SMART 的适应性和革新性。
- 深度网络的集合卡尔曼逆问题中的不确定性量化
基于 DeepONet 的运算器学习,通过利用 Ensemble Kalman Inversion (EKI) 方法,提出了一种高效的不确定性量化方法,以应对在具有有限和嘈杂数据的实际应用中的不确定性挑战。
- 图重构的综合调研:稀疏化、粗化和浓缩
图简化技术是一种应对大型图数据集复杂性和规模的有效方法,本调查研究对图稀疏化、图粗化和图凝聚等简化方法进行了全面概述,并阐述了它们在不同场景中的实际应用,为该领域的发展提供了技术综述和重要研究方向。
- 三种 NMF 算法的鲁棒性分析(L1 范数鲁棒 NMF,L2-1 范数 NMF,L2 范数 NMF)
我们的研究旨在探究非负矩阵分解 (NMF) 在面对不同类型的噪声时的噪声稳健性。通过使用三种不同的 NMF 算法(L1 NMF,L2 NMF 和 L21 NMF)以及 ORL 和 YaleB 数据集进行一系列的模拟实验,分别使用盐和胡椒噪声 - 文本到图像生成模型的概率版权保护可能失败
通过对文本到图像生成模型进行持续交互和扩大每次交互的成功概率,我们引入了一种名为 VA3 的创新在线攻击框架,揭示了这些保护机制的漏洞,并详细论证了在文本到图像生成模型的实际应用中实施概率版权保护的潜在风险。
- ChatGPT 与更多:在教育领域的生成式人工智能革命
该调查研究了生成性人工智能模型在教育领域的潜在应用和影响,并就教育环境中的实际应用、挑战和新兴趋势进行了综合和严格的评估,旨在为人工智能与教育之间的关系作出贡献。
- 可验证的表示与高效规划用于部分可观察强化学习
本研究旨在解决强化学习中部分可观察马尔可夫决策过程带来的性能下降问题,并通过对表示视图的利用提出了一种可行的强化学习算法,可在部分观测输入下实现比现有算法更高的性能,推动可靠强化学习在实际应用中的应用。
- 所选之人:文本到图像传播模型中的一致字符
最新的文本到图像生成模型在提供视觉创造力方面有巨大潜力,但在一致性字符生成方面存在困难。本文介绍了一种完全自动化的解决方案,通过文本提示作为唯一输入,使用迭代的过程来生成一致性字符,并展示了其在多个实际应用中的实践。
- 带有侧观测的随机图赌博学习
提出一种算法来解决具有图反馈和一般函数空间的随机情境赌博问题,该算法适应底层图结构和奖励差距,为这种随机情境设定提供了一个依赖于差距的上界,改进了遗留问题,并通过数值实验验证了计算效率和 regret 上界的有效性,推动了具有图反馈的随机情 - 嵌入式人工智能可泛化操作技能的两阶段微调策略
通过在 Maniskill2 基准测试中提出的新型两阶段微调策略,我们展示了我们方法的有效性,并在 ManiSkill2 挑战的所有三个赛道中获得第一名,突出了我们方法提高体验式人工智能模型的泛化能力的潜力,为其在实际场景中的实际应用铺平了 - ICML野外场景中的标注者一致性:揭示其在真实场景中的新兴作用和考虑因素
本文讨论了 Inter-Annotator Agreement 作为一种标签一致性的计量方式,在实际应用中的角色和含义,同时也提出了多种考虑和潜在问题,并建议有效的应对策略。
- 对抗性游戏中的决策分析
本文从多个角度对对抗博弈中三种主要的游戏模型(零和标准型和扩展型游戏,Stakelberg 安全游戏和零和微分游戏)进行了系统的调研,涵盖了游戏模型基础知识,平衡概念,问题分类,研究前沿,最优策略寻找技术,主要算法和实际应用,并探讨了未来的 - 基于深度学习的社区发现综述
本文对近年来深度学习在社区检测领域的最新进展进行了全面概述,提出了包括深度神经网络、深度非负矩阵分解和深度稀疏滤波在内的多种先进方法,总结了常用的基准数据集和评估指标,并讨论了社区检测在不同领域的实际应用和实现场景,并提出了未来的研究方向。
- AAAI分布式稳健的反事实风险最小化
本文介绍了使用分布式鲁棒优化 (DRO) 解决交叉事实风险最小化 (CRM) 问题的想法,并证明了 DRO 是对策反决策的一种有原则的工具。我们提出了使用 Kullback-Leibler 马氏距离作为 CRM 中不确定性的代替方法,并基于 - 深度强化学习简介
介绍了深度强化学习的模型、算法和技术,着重讨论与泛化相关的方面以及深度强化学习在实际应用中的使用。