validation | BriefGPT - AI 论文速递

关键词validation

搜索结果 - 51

解释可解释性：通过二阶可解释性深入了解深度学习的可操作性洞察
该文研究了深度神经网络模型的可解释性，提出了 SOXAI，探索了将其作为数据集级别的解释，以消除数据集偏差，从而提高模型的性能。
PDFa year ago
测试系统智能
讨论了智能系统测试的足够性和实现过程中遇到的问题，并提出了一种替代测试方法，介绍了该方法如何刻画 Turing 测试无法涵盖的人类智能的显著方面。提出了实现替代测试以及验证智能系统属性的框架，并探讨了智能系统验证的内在限制，并建议新的理论基
PDFa year ago
Tinto: 面向地球科学的 3D 高光谱点云多传感器分割基准
Tinto data set provides a benchmark for deep learning models in geological mapping through non-structured 3D digital out
PDFa year ago
工程设计应用的合成数据集创建指南
本研究提出了用于生成、注释和验证合成数据集的全面指南，着重于感知数据集大小、多样性、实用性和现实性的方法。此外，还通过创造一个涡轮压缩机数据集来说明这些指南的实际应用中的重要性。
PDFa year ago
使用机器学习验证医院数字孪生模型
本文介绍了使用基于代理的仿真模型来创建数字孪生体以优化医疗流程，使用机器学习以验证模型并进行敏感性分析的工作。
PDFa year ago
基于规则的异常检测
采用可解释人工智能 (XAI) 方法，使用不同的度量标准来识别样本的相似程度，验证模型非参数和分布假设的假设，检测机器学习中最关键的问题之一 —— 超出分布检测，并在预测维护、车队编队和网络安全等复杂情境中进行了验证，得出了精确的检测和对训
PDFa year ago
半监督约束聚类：深入概述，分类排名和未来研究方向
本文详细介绍了约束聚类算法的背景和各种可用约束类型的评级分类，重点研究了基于实例级对偶约束的约束聚类及应用程序和历史背景，并对 307 种约束聚类方法进行了统计分析，根据其受欢迎程度和验证质量对其进行了分类和排名评分，最后提供了潜在的陷阱和
PDFa year ago
使用 ReLM 验证大型语言模型
本文介绍了用标准正则表达式验证和查询 LLMs 的 ReLM 系统，其结果表明 ReLM 的最高系统效率是现有方法的 15 倍，数据效率是现有方法的 2.5 倍，并且具有竞争力和较高的统计学和提示调整覆盖率。
PDF2 years ago
EMNLP自然语言推断与不完整信息
提出了一个处理模糊的假设的新系统，使用自然语言生成模型来从一个前提中推出另一个前提并以双向的方式搜索。使用回路验证程序过滤质量不佳的生成来确保正确性。该系统在修改后的 EntailmentBank 数据集和名为 “Everyday No
PDF2 years ago
EMNLP通过桥接训练 - 推理差距实现密集短语检索
本研究探讨了如何通过有效验证缩小训练与检索之间的差距并提高稠密检索的性能，在密集短语检索中取得了 2~3 个关键短语检索准确度和 2~4 个段落检索准确度的提升。
PDF2 years ago
KDD基于可解释人工智能的消融研究分析
针对可解释人工智能 (XAI) 方法缺乏基础事实的问题，研究人员提出了基于公理的方法，通过削弱输入属性的重要性来评估模型性能是否符合期望；本文则使用五个数据集，三种 XAI 方法，四个基线和三个扰动方案，展示了不同的扰动策略在验证过程中的作
PDF2 years ago
ECLAD：使用局部聚合描述符提取概念
通过 CNN 激活图像素聚合的表示，提出了一种新型的自动概念提取和定位方法，并基于图像的像素注释，引入了一种验证过程来减少人工干预，从而超越了现有方法。
PDF2 years ago
CVPR关于高效训练和验证端到端驾驶模型选择数据的研究
本文探讨了数据生成与验证方式对深度驾驶模型的训练和性能影响，通过在 CARLA 模拟器上的实验结果提出了数据生成和行车路线选择的建议，以实现高效开发 end-to-end 驾驶模型。
PDF2 years ago
ICML解释性的心理学理论
研究人员提出了一种心理学理论，解释了人们如何从显著性图中得出结论，为 XAI 中的精确预测和验证提供了理论依据，并进行了一项用户研究以验证该理论。
PDF2 years ago
ICCV低样本验证：主动重要性抽样用于估计稀少类别的分类器性能
我们提出了一种统计验证算法，用于准确估计二元分类器的 F 得分，特别适用于罕见类别，并且证明该算法可以使用较少的标签进行验证。
PDF3 years ago
神经网络自然语言处理的事后可解释性：一项综述
本文主要讨论了近期后续方法如何向人类传达模型解释的分类，深入讨论了每种方法及其验证过程。
PDF3 years ago
ICLR数据分割对泛化性能的影响：从咳嗽和语境中识别 COVID-19
本文探讨了使用深度学习技术从手机数据中识别 COVID-19 患者的方法，分析了模型在不同时间和地点分割后的效果，并研究了患病和无症状个体在三个数据分割上的性能表现。
PDF3 years ago
AAAI准确度指标的鲁棒性及其在带有噪声标签的学习中的启示
本文研究了多类分类中标签噪声的问题，证明准确度度量本身可以是健壮的，并探讨了噪声数据下的训练和验证问题，同时针对模型选择问题提出了一种新的框架 NTS，并提供了相应的代码。
PDF4 years ago
跨图表示学习实现高效知识图谱验证
利用知识图谱中概念语义信息的交叉表示学习框架 CrossVal，通过嵌入三元组、绘制交叉负样本及估计每个三元组的正确性程度来有效验证知识图谱中的三元组。
PDF4 years ago
AAAI具有正负例的泛化规划
本文将负例规划定义为一组不应由泛化计划解决的计划实例，并将计划验证的概念扩展到验证给定泛化计划解决输入正例实例时是否无法解决给定的一组负例实例，以量化评估泛化计划的能力，并展示如何将负例规划应用于计划综合的编译中，实验结果表明添加负例可以加
PDF5 years ago