- 在数据分布转移下自主系统的评估
数据分布转变达到某个阈值时,自治系统必须放弃控制并停止运行或移交给人工操作员,本文通过计算机视觉玩具例子演示了数据分布转变对网络预测准确性的影响,并提出了训练数据和测试数据之间的距离度量来定义在这些转变范围内的安全操作限制,结论是当数据分布 - 人口动态的在线控制
基于在线控制的新框架提出来,用于人口控制研究,以解决现有数学模型仅限于特定、无噪声动力学情况而实际人口变化复杂和对抗性的问题。通过使用一组线性动力系统和基于梯度的控制器,实证评估结果验证了该算法在包括 SIR 和复制者动力学的非线性模型中对 - 基于扩散的离线强化学习中的长时程回滚动态模型
探索如何将扩散模型(DMs)的能力作为动力学模型在完全离线环境中解耦,以允许学习策略展开轨迹,并展示了 DyDiff 在离线强化学习中的有效性。
- 协同视频扩散:具有摄像机控制的一致多视频生成
视频生成的研究最近取得了巨大的进展,使得高质量的视频可以从文字提示或图像中生成。为视频生成过程添加控制是一个重要的目标,并且最近的方法通过在相机轨迹上条件化视频生成模型来朝着这个目标迈进。然而,从多个不同相机轨迹生成相同场景的视频仍然具有挑 - 无伤害:一种针对安全强化学习的对比方法
通过对学习策略与默认的安全策略进行比较,我们提出了一种对反事实伤害进行约束的方法,在考虑不确定性和复杂环境表示的基础上实现了学习更安全策略的目的。
- RefFusion:3D 场景修复的参考适应扩散模型
我们提出了一种基于多尺度个性化图像修复扩散模型的新型三维修复方法 RefFusion,通过引入参考图像,实现了对修复内容的显式控制,从而在保持高可控性的同时取得了最先进的物体去除效果。
- 极值寻求动作选择以加速策略优化
通过引入基于极值搜索控制的自适应控制步骤,改进了模型自由强化学习中的动作选择,在标准策略优化中提高了学习效率。
- 基于可微分仿真与优化的任务最优数据驱动代替模型
我们提出了一种用于控制中最优性能的 Koopman 代理模型端到端学习的方法。与以往使用标准强化学习算法的方法不同,我们使用一种训练算法,该算法利用了基于机械模拟模型的环境的潜在可区分性。通过将我们的方法与其他控制器类型和训练算法组合在文献 - 使用通用移动操纵器在现实世界中打开橱柜和抽屉
构建了一个端到端系统,使得一种移动机械手(Stretch RE2)能够在多样化的前所未见的真实环境中打开橱柜和抽屉,并通过四天的测试,在未见过的环境中成功率达到 61%,并分析了感知误差是主要挑战。
- Sketch2NeRF: 多视图草图引导的文本生成三维模型
通过多视角草图引导的文本到 3D 生成框架,使用预训练的 2D 扩散模型对神经辐射场进行优化,以实现从草图到生成 3D 场景的灵活控制。
- NODEC: 用于未知动态系统的神经常微分方程优化控制
通过耦合的神经 ODE 模型,NODEC 实现了对未知动力学系统的控制以及目标状态下的优化控制,展示了其在学习未知动力学系统的最优控制方面的有效性和数据效率。
- 学习准确可线性化的深度动力学模型
基于机器学习方法的控制研究现已过渡到实际工程阶段。本文提出了一种学习方法,用于确保系统的稳定性、可靠性等方面,为各种控制理论提供了高度的自由度,以实现高性能和理论上的安全性。通过将简单线性控制与控制屏障函数相结合,展示了一个设计示例,并将其 - DiffuseBot:利用物理增强的生成式扩散模型培育软体机器人
DiffuseBot 是一种通过物理动力学模拟生成软体机器人形态,并实现在各种任务中出色表现的扩散模型。
- 驯服波动:物理可解释的机器学习框架用于可实现波动控制
介绍了一个用于研究有源变形材料设计控制声波的环境,并开发了一种基于深度神经网络的机器学习方法,可以有效地学习声波的动态。该方法可预测和控制散射波能量,在声学中解决了最小化总散射能量的重要问题。
- 用于高效多主题控制文本生成的继承特征
大型语言模型(LLMs)在生成流畅和逼真的文本方面取得了令人印象深刻的性能,但控制生成的文本以展现安全性、真实性和无毒性等属性仍然具有挑战性。本研究提出了 SF-GEN,它基于两个主要概念:后继特征(SFs)用于将 LLM 的动态与任务特定 - 电力网络拓扑控制的分层强化学习
使用层次强化学习方法控制电网拓扑结构,通过在不同层次应用强化学习算法,实现电网操作的长期目标且在困难任务上超越其他方法。
- 基于深度 Maxout 网络特征融合与政治切线搜索优化的转移学习用于地中海贫血检测
用于地中海贫血检测的政治切线搜索优化器基于迁移学习 (PTSO_TL) 在正常化数据、特征融合、数据增强和训练调优等阶段的整合应用中,达到了约 94.3%、96.1% 和 95.2% 的最大精度、召回率和 F 值。
- ZeroGen:多模态离线控制的零样本文本生成
提出了一种零样本可控多模态文本生成模型 ZeroGen,将文本和图像联合在解码过程中加权相加,通过动态权重机制调节交叉模态权重来实现多模态控制。模型在三个下游任务中的表现超越了同类模型,表现出良好的可控性和潜力。
- 物理信息机器学习在动态系统建模和控制中的应用
本文概述了物理相关机器学习在动态系统建模和控制方面的最新进展、基本概念和方法、工具及应用。
- 自动驾驶和智能车辆里程碑二:感知和规划
本文通过三个独特的文章,概述了自动驾驶技术和智能车辆发展的历史、进展、伦理和未来方向,重点探讨了控制、计算系统、通信、高清地图、测试和人类行为等各方面的技术发展。