validation | BriefGPT - AI 论文速递

关键词validation

搜索结果 - 50

塔防游戏中高级策略控制的强化学习
提出一种自动化的游戏测试和验证方法，结合传统脚本方法和强化学习以适应新情况，测试结果表明使用学习方法和脚本人工智能相结合的代理比单独使用启发式人工智能更强大和稳健，成功率达到 57.12%。
PDF22 days ago
肺健康中的人工智能：在多个 CT 扫描数据集上对检测和诊断模型进行基准测试
肺癌早期检测对降低高死亡率具有重要作用，而人工智能在诊断成像方面的应用日益重要。该研究利用 Duke Lung Cancer Screening Dataset (DLCSD) 开发和验证了 DLCSD-mD 和 LUNA16-mD 模型，
PDF2 months ago
Transformer 模型对随机数字进行分类
我们的研究通过使用变压器架构编码 NIST STS 的部分测试，提出了一个深度学习模型，该模型在单个模型中运行得更快，并对这些测试进行多标签分类，并输出通过每个统计测试的概率，从而实现了高度准确度，样本 F1 得分超过 0.9。
PDF2 months ago
链式思维引导的通用验证
通过探索不同的思维链和验证推理过程中的各个步骤，我们提出了三个模型应遵循的原则（相关性、数学准确性和逻辑一致性），并将这些原则应用于大型语言模型的推理步骤，以提高最终生成结果的准确性。通过使用困惑度作为额外的验证器来引导高质量解决方案的生成
PDF2 months ago
GeoAI 的可重复性和可复制性：计算和空间视角
GeoAI 研究偏重于 GIScience 文献，本文从计算和空间角度深入分析了 GeoAI 研究的重复性和可复制性，包括验证、学习和适应方法以解决相似或新问题，以及研究结果的普适性。通过深度学习的图像分析任务实例，强调了训练数据选择和使用
PDF3 months ago
利用插值模型和误差界提高可验证的科学机器学习
验证和验证现代科学机器学习工作流程的有效技术是很具挑战性的。本研究通过展示（1）多个标准插值技术具有信息丰富的误差界限，可以进行高效计算或估计；（2）不同插值器之间的比较性能有助于验证目标；（3）在深度学习技术生成的潜在空间上部署插值方法，
PDF3 months ago
如何验证机器学习回归任务的平均校准性？
根据最新机器学习不确定性量化文献上的数据集集成，本文展示了标定误差 (CE) 极其敏感于不确定性分布的特点和异常值不确定性的存在，因此不适合用于标定测试，相比之下，ZMS 统计量在这个背景下提供了最可靠的方法，并且探讨了条件标定验证的启示。
PDF5 months ago
空间环境下预测方法的一致验证
空间预测是天气预报、空气污染研究等科学探索的关键。确定在统计或物理方法中信任预测的程度对科学结论的可信度至关重要。本文中我们基于现有的共变量转移方法，根据验证数据提出了一个新方法，并在模拟和真实数据上通过经验证明了其优势。
PDF5 months ago
本科申请中的录取预测：一种可解释的深度学习方法
本文提出了利用深度学习分类器解决本科招生委员会决策验证的问题，并通过引入解释性模块 LIME 对模型进行进一步的解释与分析。通过使用具有多个变量和信息的申请者数据集进行训练和测试，我们的模型在准确性上相比传统机器学习方法提升了 3.03%
PDF5 months ago
机器中的尸体：动作捕捉技术中的测量和验证社会实践
通过社会实践理论的视角，通过对一项系统文献综述研究（N=278）的发现进行分析，我们展示了测量和验证的社会实践是如何根深蒂固地融入运动捕捉设计和创新中的，并且我们展示了当代运动捕捉系统是如何延续对人体和其运动的假设。我们认为，在数据驱动和传
PDF5 months ago
SUDO: 无需真实标注的评估临床人工智能系统的框架
通过 SUDO 框架，可以评估无标注的数据并训练模型，识别不可靠的预测结果和评估医学中 AI 系统的算法偏差。
PDF6 months ago
自动驾驶车辆验证中桥接数据驱动和知识驱动方法的安全关键场景生成
自动驾驶车辆的验证是开发和性能评估的关键，本文通过数据驱动和知识驱动方法分析场景生成的复杂性，并引入 BridgeGen 框架以整合两种方法的优势，以提高生成各种安全关键场景的效率。
PDF8 months ago
mlscorecheck：测试机器学习中报告的性能分数和实验的一致性
通过验证报告的实验结果来解决人工智能中的可复现性危机是一项具有挑战性的任务，为了促进对报告结果的验证，我们开发了数值技术，能够识别在机器学习问题中，包括二元 / 多类别分类和回归分析中，报告的性能得分与各种实验设置之间的不一致性，这些一致性
PDF8 months ago
通过 RDF 知识图谱和句子相似度验证 ChatGPT 的事实
该研究提出了一种使用 RDF 和知识图谱验证 ChatGPT 事实的新型流程，通过利用 DBpedia 和 LODsyndesis 以及短句嵌入，返回与 ChatGPT 响应相关的三元组以及它们的来源和置信度，从而验证并丰富 ChatGPT
PDF8 months ago
基于模拟的自动驾驶辅助系统安全验证，包含学习能力组件
自动驾驶和驾驶辅助系统领域的安全保障、测试验证和验证安全关键应用的方法仍然是主要挑战之一，本文介绍了基于仿真的开发平台，用于验证和验证连续工程循环中的安全关键学习型系统。
PDF9 months ago
交通场景相似度：基于图形对比学习的方法
通过使用图形来构建一个有意义的嵌入空间，我们的方法展示了场景的连续映射以及基于嵌入结果形成主题相似群集，从而在后续测试过程中识别相似场景，从而减少冗余测试运行。
PDF10 months ago
反问题中基于应用的后验验证
当前深度学习的解决方案普遍无法处理存在多个不同合理解决方案的问题。为了解决这个问题，出现了基于后验的方法，如条件扩散模型和可逆神经网络，但由于缺乏适当的验证研究，它们的转化受到阻碍。为了弥补文献中的这一空白，我们提出了应用驱动的后验方法验证
PDF10 months ago
可解释的机器学习对于发现的统计挑战与机遇
通过解释性机器学习，可以从大数据集中生成新的知识或进行发现，验证这些发现有助于提高机器学习系统的可信度和科学的可重复性。从实践和理论两个角度出发，我们讨论解释性机器学习的技术与挑战。
PDFa year ago
一种强化学习方法用于视觉问答验证：以糖尿病黄斑水肿分级为应用
通过自动自适应提问方法来更好理解针对医学图像分析的机器学习模型的性能，以提供更丰富和适当的验证方法，目的是揭示针对图片相关任意问题回答的高效视觉问答算法的推理行为。
PDFa year ago
解释可解释性：通过二阶可解释性深入了解深度学习的可操作性洞察
该文研究了深度神经网络模型的可解释性，提出了 SOXAI，探索了将其作为数据集级别的解释，以消除数据集偏差，从而提高模型的性能。
PDFa year ago