- Panoptica -- 3D 语义和实例分割地图的逐实例评估
该论文介绍了一个名为 panoptica 的软件包,用于计算 2D 和 3D 分割映射的实例级分割质量指标。panoptica 通过引入不同的指标,如平均对称面距离,弥补了现有指标的局限性,并提供了一个模块化框架。该软件包是开源的,使用 P - 维基百科文章的自动质量评估 —— 系统文献综述
维基百科是世界上最大的在线百科全书,但通过合作维护文章质量是具有挑战性的。本文回顾了现有的自动测量维基百科文章质量的方法,并识别和比较了机器学习算法、文章特征、质量指标和使用的数据集,检查了 149 个独立的研究,并探讨了它们之间的共同点和 - 基于 Transformer 的变量图像质量目标图像压缩
这篇论文介绍了一种基于 Transformer 的图像压缩系统,根据用户的偏好提供可变的图像质量目标,通过引入提示符令牌,使得自适应生成,学习和适应编码和 / 或解码过程的方法,在可变的质量目标下提高了压缩效果。
- 衡量文本 - 视频模型输出的质量:指标和数据集
我们评估了常用质量度量,比较它们与人工评估在包含 1000 多个生成的 T2V 视频的数据集上的表现。结论是,在评估 T2V 模型输出时,自然性和语义匹配是重要因素,但没有一种单一度量可以捕捉这些微妙之处。
- 揭示合成图像的实用性:不必完美也能出色
深度生成模型生成的合成图像可以解决数据缺乏和数据隐私问题。然而,图像质量评估仅仅基于图像质量测量,并且绝大部分研究者更青睐于产生逼真的图像的合成模型,即具有良好保真度评分,例如低 FID 和高 PSNR 的图像。本研究通过分析超过 100k - 如何在没有数据的情况下识别出优秀的深度神经网络分类器
该论文提出了一种无需测试数据即可评估训练后 DNN 分类器的质量的方法,通过在输入空间中迭代创建每个类别的类原型来实现,这些原型和其特征关系可用于揭示分类器的质量,并开发了两个使用原型特征和对应于每个原型的对抗性示例的质量度量指标,其准确性 - 结肠镜检过程的半监督质量评估
本文提出了基于 ML 模型的在线和离线质量度量标准,该模型学习了视觉外观质量标准,并评估了检测到已知息肉的可能性,以证明所提出的度量标准与息肉检测的灵敏度高度相关。这些度量标准可以实时提供质量反馈给医生,这对于肠镜检查中错过的息肉数与检测质 - 具有增量最近邻的强鲁棒性时间序列链发现
本研究提出了一个能够更好地定位时序连续演化模式的时间序列链 (TSC) 定义,并提出了两个新的链质量评估指标,在实际数据检验时显著更具鲁棒性,能够揭示多个现实世界数据集中有意义规律。
- 知识图谱维护:一个实用框架
本文提出了一个实用的知识图谱策划框架,包括度量质量、验证和清理任务、查重和融合策略,旨在优化知识图谱质量。
- 生物特征质量评估及其在人脸识别中的应用(以 FaceQnet 为例)
本篇论文介绍了生物特征识别的基本概念和在人脸质量度量方面的研究,提出了一种基于深度学习技术的开源脸部质量评估工具,并通过 NIST 的评估证明了其优越性。
- 序列型演员 - 评论家算法在图像字幕生成中的应用
本研究探究了基于 actor-critic 强化学习的图像标题生成模型的训练方法,通过计算每个 token 的优势和值实现直接优化语言质量指标,取得了在 MSCOCO 数据集上的最先进性能。
- 稠密光场的质量度量
本研究创建了一个人体主观质量评价数据集,测试了现有图像质量度量在评价彩色光场视图质量方面的性能,并发现了在度量质量方面还需要新的彩色光场特定的指标。
- LIBSVX:用于早期视频处理的超像素库与基准
通过研究七种监督体素算法的质量指标和分类任务结果,研究人员发现基于图形的方法(GBH)、加权聚合的分割(SWA)和时间超像素方法(TSP)是七种方法中最有效的,这三种方法不仅在分割准确性上表现良好,还具有不同的优点,例如 GBH 捕捉的对象 - EMNLP视觉与语言研究中当前数据集的调查
本文提出一组质量指标,对视觉和语言数据集进行评估和分析并将其分类,结果显示最近的数据集在语言和抽象概念上更加复杂,然而它们各有优劣之处。