关键词dataset characteristics
搜索结果 - 8
- 数据集公平性:通过效用保证在您的数据上实现公平
机器学习公平性经常导致准确率下降,我们提出了一种基于数据集的高效方法来逼近公平性 - 准确性权衡曲线,并通过引入置信区间来量化逼近的不确定性,从而为各种数据模态下的数据集特定公平决策提供了一种有原则的框架。
- 从变化到稳定:推荐系统基准实践的进一步发展
通过使用多样化的 30 个开放数据集和 11 个协同过滤算法在 9 个评估指标下的评估,本论文引入了一种新的基准方法,以促进推荐系统算法的公正和稳健比较,从而推进评估实践。通过严格的实验分析,验证了在数据集的变化性下的方法可靠性,提供了一个 - 基于 COVID-19 的 AI 诊断方法中的数据多样性和虚拟成像:以病例研究为例
通过使用临床多样性数据和虚拟生成的医学影像,开发和评估了基于深度学习人工智能模型进行新冠病毒 COVID-19 诊断的人工智能模型,并进行了相关影像试验以评估疾病程度、辐射剂量和影像模态等因素对人工智能性能的影响。研究突出了数据集特征和疾病 - 挑战图形协同过滤的神话:理性和可重复性分析
我们的研究聚焦于图神经网络模型的可复制性,通过复现六种热门的图推荐模型在三个常见基准数据集上的结果来解决原有图模型研究中常采用未经验证结果的问题。此外,我们还将这些图模型与传统的协同过滤模型进行比较,并扩展研究至两个缺乏已建立的设置的新数据 - 评估大型语言模型在生成准确教师回应方面的有效性
通过评估多个基准生成模型在教育对话中提供信息和帮助学生的能力,本研究旨在模拟一个有知识的老师的角色,并发现 GPT-4 在教师 - 学生聊天记录子集上的优越性,测量标准是 BERTScore 和 DialogRPT,同时注意到采样、代表性和 - 在线异常检测器的元层分析
本文提供了对不同算法家族的主要在线探测器的质量、综合概述,包括构建、更新和测试探测模型的主要思想,并提供了在线检测算法与离线对应算法的结果定量实验评估的彻底分析,以及对数据集(即元特征)的各种特征进行统计分析。
- 神经代码摘要评估
本文采用系统性和深入分析方法,分析了 5 种最先进的神经代码自动摘要模型在 6 种广泛使用的 BLEU 变量、4 种预处理操作及其组合以及 3 种广泛使用的数据集上的评估结果,发现评估代码摘要模型的三个主要因素 ——BLEU 评估指标、代码 - 利萨宁数据分析:通过描述长度检查数据集特征
本文提出了利用所谓的最小程序长度为依据,实现数据准确建模的方法,称为 Rissanen 数据分析(RDA)。该分析在自然语言处理等领域有着广泛的应用,能在不可计算的前提下,估计数据的最小描述长度,以研究数据特性。