- 电网拓扑优化中的代理故障检测:一项综合分析
通过深度强化学习(DRL)对传输网络进行拓扑优化已经成为研究热点。本研究针对电力网格故障进行失败模式识别,并通过多类别预测方法探测故障,最终得出特征重要性分析结果。
- 医学图像分割中故障检测方法的比较基准:揭示置信度聚合的作用
本文介绍了一个用于评估医学图像分割中失败检测方法的综合基准框架,通过分析我们确定了当前失败检测度量的优点和局限性,并推崇风险覆盖分析作为一种整体评估方法,通过在包含五个公开的三维医学图像集合的综合数据集上评估各种失败检测策略的有效性,我们发 - 闭环 LLM 规划器的基于不确定性的故障检测评估
通过引入一个名为 KnowLoop 的基于不确定性的 MLLMs 故障检测器支持的闭环 LLM-based planning 框架,我们试图减轻 LLM-based planning 的开放环路问题,进而提高任务的成功率。
- 人机交互中基于人类反应的故障检测的领域泛化研究
在该研究中,我们通过对人类面部表情的故障检测模型进行训练,并使用两个不同的人类反应视频数据集进行测试,一个来自受控实验室环境,一个来自在线收集的数据集,发现在不同数据集上测试时模型的性能显著下降,这引发了我们对观察到的模型行为原因的思考,并 - 多模态交接失败检测数据集与基线
人机交接的失败检测及数据集构建方法研究。
- 一种针对高度不平衡工业数据的成本敏感的 Transformer 模型
该文介绍了一种新颖的成本敏感变压器模型,该模型通过融合混合型采样器和基于回归的填充器,以及经过严格测试的方法,从而在工业环境中预测故障方面表现出比现有方法更好的性能,并分析了所提出方法中不同组成部分的贡献。研究结果凸显了该方法在解决工业设置 - 基于模型的实时监控与交互式模仿学习
通过模型学习和故障检测机制,该论文提出了一种基于互动模仿学习的机器人监控算法,能够实时监测任务执行过程中的失败,并预测可能发生的故障,从而提高任务可靠性。
- PAGER:深度回归模型故障分析框架
深度回归模型中失败检测的系统性分析框架 PAGER 能够通过利用先验不确定性和新颖的非一致性评分从不同风险范围划分样本,并提供模型错误的全面分析。在合成和真实基准测试中展示了 PAGER 的有效性,能够识别精确泛化的区域并检测超出分布和支持 - 度量模型可信度的实证最优风险用于故障检测
AI 系统中的失败检测是安全关键任务部署的重要保障,通过计算最优风险覆盖曲线下的区域和模型在此最优点上的性能,我们提出了衡量失败检测方法适用性和模型可信度的指标,通过实验验证了其有效性。
- 构建安全可靠的用于安全关键任务的视觉与语言处理的人工智能系统
AI 系统在各个领域取得了令人瞩目的成绩,然而其安全性和可靠性仍然是一个重要的关注点,特别是对于安全关键任务。本论文旨在通过进一步开发当前技术来确保安全关键任务的准确模型不确定性。
- ICML伟大的模型思考一致:通过模型潜在一致性改善模型可靠性
本文提出了一种通过测量模型潜在空间与基础模型潜在空间之间的一致性来估计模型可靠性的方法,并设计了一种邻域一致性度量方法,该方法与模型的预测置信度相结合显著提高了模型的可靠性,并在各种数据集上的失败检测实验中验证了该方法的有效性。
- 通过价值近似在行为克隆中预测失败并请求帮助
该研究提出了一种利用行为克隆值近似的方法,通过学习状态值函数来预测故障,并改进了针对具有挑战性的移动操作任务的失败分类基线。
- DeFIX: 基于强化学习的模仿学习自动驾驶故障场景检测和修复
本文基于强化学习(RL)提出了 DETECT and FIX(DeFIX)方法来解决自主驾驶中违反交通规则的问题,通过提取违规点和在这些违规区域上重新构建小场景来训练 RL agent 以修复 IL agent 的缺陷,通过对目前最具挑战性 - 医学图像分类中的故障检测:现实检验和基准测试
本文研究了自动图像分类中的故障检测,通过对 6 个医学影像数据集的测试发现,现有的置信度评分方法无法准确检测分类模型的测试失败,建议今后加强研究,提高故障检测的准确性。
- 使用好奇心驱动增强学习的自动 Web 测试
WebExplor 是一种自动化的端到端 Web 测试框架,采用基于好奇心的强化学习生成测试用例,满足时间逻辑关系,能够显著提高故障检测率和代码覆盖率。
- ECCV综合比对:用于语义分割的故障与异常检测
本文提出了一个统一框架用于语义分割的失效和异常检测,该框架由两个模块组成,一个是图像合成模块,另一个是比较模块,在三个数据集上进行验证并大幅提升现有方法的状态,例如在 Cityscapes 上的 6%AUPR-Error,在 MSD 中胰腺 - 评估医学图像分割不确定性估计的可靠性和挑战
本文研究深度学习系统在医学图像分割方面的不确定性评估方法,发现现有不确定性评估方法在数据集水平表现良好但在个体水平出现偏差,因此需要开发个体化的评估方法。研究还发现辅助网络是一种有效的评估方法。