高效知识图谱准确率评估

Jul, 2019

Efficient Knowledge Graph Accuracy Evaluation

Junyang Gao, Xian Li, Yifan Ethan Xu, Bunyamin Sisman, Xin Luna Dong...

TL;DR通过使用簇抽样、加权和两阶段抽样，以及分层的抽样设计，提出了一种有效的抽样和评估框架，该框架旨在在最小化人力成本的同时提供具有强大统计保证的高质量的准确性评估。

Abstract

Estimation of the accuracy of a large-scale knowledge graph (KG) often requires humans to annotate samples from the graph. How to obtain statistically meaningful estimates for accuracy evaluation while keeping

knowledge graph accuracy evaluation human annotation cluster sampling statistical guarantee

发现论文，激发创造

一种高效的模型评估框架：分层、抽样和估计

模型性能评估是机器学习和计算机视觉中的关键而昂贵的任务。在本文中，我们提出了一种模型评估的统计框架，包括分层、抽样和估计组成部分。我们的实验表明，通过基于准确的模型性能预测进行 k-means 聚类的分层方法能够提供比传统的简单随机抽样更为精确的准确度估计。

Jun, 2024

机器翻译人类评估的有效性改进探讨

本研究探讨了一种简单的降低标注成本的方法，即采用分层抽样和控制变量等技术，结合文档成员身份信息和自动评估指标，从而在固定标注预算下获得更高的准确性。在测试集上，相比于纯随机抽样，平均误差降低了高达 20%。该技术易于实现且适用于类似结构的问题。

Apr, 2022

我们是否浪费了时间？一个快速、准确的知识图谱链接预测器绩效评估框架

我们在这篇论文中对知识图谱完成方法的标准评估协议进行了全面的分析，发现了采用随机抽样评估链接预测或建议方法的严重局限性，并提出了一种使用关系推荐器指导评估候选对象选择的框架，通过有效的预处理和抽样方法，可以在大大减少计算时间的同时，可靠地预测整个排序过程的实际性能。

Jan, 2024

关于数据标注的高效和统计质量估计

使用置信区间寻找估计注释错误率所需的最小样本量，然后提出应用接受抽样作为错误率估计的一种替代方法，展示接受抽样可以减少最多 50% 的所需样本量，同时提供相同的统计保证。

May, 2024

高效非采样知识图谱嵌入

通过提出 Efficient Non-Sampling Knowledge Graph Embedding（NS-KGE）框架，该研究将知识图谱嵌入模型中的负采样方法转变为全量消除，并使用数学推导减少了模型计算复杂度，既提高了效率也提高了准确性。实验结果表明，与传统方式相比，NS-KGE 框架在效率和准确度上均有所提高，并适用于多类知识图谱嵌入模型。

Apr, 2021

有效高效采样图神经网络的分层估计

本文提出一种名为 HE-SGNN 的 GNN 模型，它使用两级嵌套的估计器来减少采样方差，并且使用不同的估计器来应对不同的采样方法。实验结果表明，该模型的效果和效率都很高。

Nov, 2022

跨图表示学习实现高效知识图谱验证

利用知识图谱中概念语义信息的交叉表示学习框架 CrossVal，通过嵌入三元组、绘制交叉负样本及估计每个三元组的正确性程度来有效验证知识图谱中的三元组。

Aug, 2020

保持积极：无需负采样的知识图谱嵌入

该论文提出了一种训练过程，通过向损失函数添加新颖的正则化项，避免了使用负采样的需要，并且在两个关系嵌入模型（DistMult 和 SimplE）中得到了优异的性能和速度。

Jan, 2022

主动测试：一个高效和稳健的估计准确性的框架

本研究致力于解决在大型带噪数据集上扩大模型评估规模的问题，并采用主动测试框架，有效查询用户，以最小化审核，测试两种常见计算机视觉任务的性能指标，并表明该方法比其他评估协议更具稳健性，并能节省显着的人工标注工作量。

Jul, 2018

基于相似驱动的嵌套重要性抽样在数据集中的群集数量的人机协同估计

基于逐对相似性的人工反馈和统计估计的聚类数量方法。

Dec, 2023