performance metrics | BriefGPT

关键词performance metrics

搜索结果 - 97

视频中自动婴儿二维姿势估计：比较七种深度神经网络方法
通过比较七种不同的姿势估计方法，对婴儿在仰卧位的视频进行分析，发现除了 DeepLabCut 和 MediaPipe 外，其他方法在无需微调的情况下都表现出竞争力，其中 ViTPose 表现最佳。同时，引入颈中臀比例的错误和其他误测、多余检
PDF5 days ago
IBM 127 量子比特超导量子计算机上三比特 Grover 搜索算法的综合特性研究
使用超导量子架构的先进量子计算技术，对三比特 Grover 搜索算法进行了实现和特性研究，并通过实验评估了算法的可扩展性和性能指标，同时还进行了量子态重构实验，揭示 NISQ 计算机在大规模数据库搜索方面的潜力及 Grover 搜索算法在实
PDF7 days ago
ICML优化复杂绩效指标的通用在线算法
我们介绍和分析了一种通用的在线算法，适用于二元、多类和多标签分类问题中的各种复杂性能指标，该算法的更新和预测规则简单且计算效率高，无需存储任何过去的数据，而且对于凹函数和平滑度函数达到了 O (ln n/n) 的遗憾，并通过实证研究验证了所
PDF10 days ago
个性化语音活动检测系统的比较分析：评估现实世界的有效性
对个性化声活性检测（PVAD）系统进行了比较分析，评估其在真实世界中的有效性，并通过包括帧级误差率、话语级错误率、检测延迟和准确性以及用户级分析在内的各种性能指标提供全面的评估方法，从而深入探究各种 PVAD 变体的优势和局限性。
PDF18 days ago
令牌经济中的推理：对 LLM 推理策略的预算感知评估
考虑计算预算并结合性能指标，对比了不同推理策略在语言模型中的效果，发现复杂推理策略的成功并非仅仅基于算法的巧妙设计，更取决于分配的计算资源。
PDF20 days ago
跨变量线性集成增强型光伏发电功率预测变压器
提出了 PV-Client (Cross-variable Linear Integrated ENhanced Transformer) 用于光伏发电功率预测，采用增强 Transformer 模块捕获不同特征之间的复杂相互作用，使用线性
PDF24 days ago
信任与否：衡量 XAI 系统信任的一种新方法
本文提出了一种衡量用户对 XAI 系统的信任的新方法，结合了性能指标和信任指标，并在真实医学场景中进行了肺炎检测实验来验证该方法。
PDF2 months ago
CVPR与子流形稀疏 CNN 共同设计的亚毫秒延迟事件驱动眼动追踪系统
基于眼动追踪技术和 FPGA 数据流加速器的稀疏卷积神经网络系统拥有优秀的性能度量指标。
PDF2 months ago
不平衡分类问题的鲁棒性能指标
在不平衡分类问题中，传统的性能度量标准如 F-score、Jaccard 相似系数或 Matthews 相关系数对于类别不平衡并不稳健，因为当少数类占比接近 0 时，这些度量标准下的贝叶斯分类器的真正阳性率（TPR）也趋近于 0。为了解决这
PDF3 months ago
ConsistencyDet: 具有一致性模型去噪范式的稳健物体检测器
通过利用一种自洽模型的创新去噪概念，我们引入了一个被称为 ConsistencyDet 的新框架，用以将目标检测作为一个去噪扩散过程来表述。在训练阶段中，ConsistencyDet 使用从地面实况注释衍生的噪声注入框开始扩散序列，并调节模
PDF3 months ago
通过学习辨别性训练样本来改善算法选择和性能预测
通过调整模拟退火算法的参数，生成鉴别不同算法的轨迹数据，用于机器学习模型的选择和性能预测，相比于原始轨迹数据和探索性景观特征，能够显著提高性能指标。
PDF3 months ago
稳定代码技术报告
我们介绍了稳定代码（Stable Code），这是我们新一代的代码语言模型系列中的第一个模型，它用于完成代码补全、推理、数学和其他软件工程任务。此外，我们还引入了一种名为稳定代码指令（Stable Code Instruct）的指令变体，它
PDF3 months ago
使用深度学习方法自动识别和分割 CRAFTS 中的高连接处信息
介绍了一种基于机器学习的方法用于从三维光谱数据中提取 HI 源，并构建了一个专用的 HI 源数据集。利用 3D-Unet 分割架构，我们的方法可靠地识别和分割 HI 源，达到了 91.6% 的召回率和 95.7% 的准确性水平。这些结果证实
PDF3 months ago
基于卡尔曼滤波器的框架进行住院期间死亡预测模型的性能监控
为了在比较不同时间段的二元分类器的性能时更公平，我们提出了一种基于卡尔曼滤波器的方法，通过调整样本量和类别分布来估计性能指标的均值和随时间变化。我们在合成数据集和 COVID-19 患者的医院内 2 天预测模型上验证了该方法的有效性，并得出
PDF5 months ago
机器学习模型对天气预测的比较评估
该研究通过应用机器学习算法，分析了各种算法在使用达卡市一个气象站 20 年数据预测降水和温度变化模式方面的贡献和性能指标。研究结果突出了显著成就，并提供了有价值的洞察和特征相关性。
PDF5 months ago
数据库间活体检测：基于比较生物特征分析的见解
生物特征安全、活体检测、跨数据库场景、性能指标和数据多样化方法是本研究的关键词。本研究全面评估了活体检测模型，尤其关注它们在跨数据库场景下的表现，发现了这一领域的固有挑战，并提出了更加精细、多样化和适应性的方法。
PDF5 months ago
关于提高深度学习模型公正性的大规模经验研究
本论文开展了第一次大规模实证研究，全面比较了现有最先进的公平性改进技术的性能，结果显示不同方法在不同数据集和敏感属性上表现存在较大差异，且不同的公平评估指标产生显著不同的评估结果，其中预处理方法和内处理方法优于后处理方法，预处理方法表现最佳
PDF6 months ago
测试集 AUROC 的奇特案例
ML 模型的尺寸和复杂性在过去十年中迅速增长，但评估其性能的方法未能跟上步伐。然而，我们认为仅考虑来自测试 ROC 曲线的得分只能对模型的性能和泛化能力提供有限的见解。
PDF6 months ago
基于生物启发特征选择的慢性疾病预测数据集优化
通过比较分析，本研究证明了生物启发式优化算法在慢性疾病预测的特征选择中的有效性，并强调了数据预处理的重要性，为提高医疗保健结果提供了宝贵的见解。
PDF6 months ago
Diffusion-C: 通过损坏数据揭示扩散模型的生成挑战
使用 Diffusion-C 方法分析 Diffusion Models 的生成限制，通过对经过各种腐败方式和强度处理的输入视觉数据的使用，阐明了这些 Diffusion Models 的性能特征，并探讨了影响深度学习系统机制的噪声成分的重
PDF7 months ago