- 激活频率和 ViT 用于 3D 点云质量评估无需参考
基于深度学习的质量评估在感知多媒体质量评估方面取得了显著的提升,然而对于 3D 点云等 3D 视觉数据仍处于初级阶段。因此,我们提出了一种给定 3D 点云的无参考质量度量方法,通过集成频率幅度作为空间降解模式的指标来评估由压缩引起的质量影响 - ACL多项选择测试中的干扰项评估
对多选阅读理解测试中干扰项的质量进行自动评估,包括错误性、可信度和多样性的度量。
- 基于投影的全参考和无参考点云质量评估的简单基线
我们提出了基于投影的点云质量评估的简单基准线方法,通过使用点云的多投影来提取质量感知特征,将完整参考质量表示和非参考质量表示回归到视觉质量分数,以应对点云在存储和带宽限制下失真的需求。我们在 ICIP 2023 PCVQA Challeng - xCOMET: 透明的机器翻译评估通过精细化错误检测
本研究介绍了一种名为 xCOMET 的开源学习度量方法,它融合了语句级评估和错误跨度检测能力,并展现出在各种评估类型(语句级、系统级和错误跨度检测)方面的最先进性能,同时突出和分类错误跨度,从而丰富了质量评估。通过稳健性分析和压力测试,我们 - 提示工程对 ChatGPT 在无监督实体解析中的影响
通过对 prompting 方法在 Entity Resolution 中的效果进行系统实验研究,本论文发现 prompting 方法对 Entity Resolution 的质量有重要影响,部分评估指标更加敏感,同时也受到数据集的影响。
- SJTU-TMQA:一种用于带纹理映射的静态网格的质量评估数据库
该研究创建了一个大规模的纹理网格质量评估数据库,通过主观实验获得平均意见得分,并评估了 13 种先进的客观指标,结果显示需要更有效的客观指标。
- 全向音视频信号的感知质量评估
本研究首次建立了一个大规模的音视频品质评估数据集,用于评估全向视频的音视频质量。通过多模态融合策略,设计了三种基准方法来评估全向音视频的品质,并验证了融合方法在全向体验评估中的有效性。
- NTIRE 2023 视频增强挑战的质量评估
本文报告了 NTIRE 2023 视频增强质量评估挑战,该挑战将与 CVPR 2023 的新趋势图像恢复和增强研讨会一同举行。该挑战旨在解决视频处理领域中的一个主要问题,即增强视频的视频质量评估(VQA)。该挑战使用了感知视频增强(VDPV - ViCE!在图像生成评估中模仿人类的认知行为
通过模拟人类认知过程,我们提出了一种新的自动化的视觉概念评估方法(ViCE),用于评估生成 / 编辑的图像与相应提示 / 说明之间的一致性,并为图像评分。虽然这种模拟人类在图像评估过程中的新假设正处于初步评估阶段,但结果令人鼓舞,并为一种新 - 通过文本提示评估推进零样本数字人类质量评估
提出了 SJTU-H3D 数据库,包含 40 个高质量的数字人类参考数据和 1120 个用七种类型的失真生成的标签失真数据,还提出了零样本 DHQA 方法,以确保泛化能力,减轻数据库偏差,并引入了数字人类质量指数(DHQI)来提高性能。
- 使用深度变分聚类的专家无关超声图像质量评估
提出了一种用于超声图像质量评估的无监督学习自编码器网络 US2QNet,在预处理、聚类和后处理三个模块的共同作用下,高效提取、聚类和可视化超声图像的质量特征表示,经过验证,该框架可以高效准确地评估尿路超声图像的质量。
- GMS-3DQA:基于投影的网格小块采样用于 3D 模型质量评估
该研究提出了一种新的基于投影的 3D 模型质量评估方法 - GMS-3DQA,通过使用多投影网格小块采样策略减少冗余和推理资源,并使用 Swin-Transformer 微型骨干从采样的网格小块中提取质量感知特征,实验结果表明,该模型相比现 - 基于基准测试、分析和结构估计的去模糊
本文讨论了评估去模糊方法质量的挑战,并提出了一种基于机器学习的降低参考度量。我们创造了一个新的运动模糊数据集,使用梁分束器,以各种运动类型为特征。我们进行了两次大规模主观比较,以帮助指标开发,并且我们的度量结果不需要 GT 框架,并且与人类 - 移动非接触指纹图像质量 (MCLFIQ)
提出了 MCLFIQ 算法,它是首个用于移动无接触指纹的质量评估算法。该算法使用一个合成的无接触指纹数据库来重新训练了用于接触式指纹的 NIST 指纹图像质量(NFIQ)2 方法,并在三个真实的无接触指纹数据库上评估了其性能,结果显示该方法 - 用于自动驾驶应用的智能路边基础设施传感器质量评估框架
通过对不同类型传感器的定量质量评估,该研究为未来的智能交通基础设施传感器提出了一种多模式框架,有效地用于 ITS-S 应用中。
- 用于自动评估胎儿超声视频质量的分层代理强化学习框架
本研究通过强化学习提出了一个双层质量评估模型,能有效地评估超声图像的质量,通过稀疏的二进制注释训练,结果证实该模型能够胜任胎儿脑数据质量评估任务。
- 误差分析提示使得大型语言模型的翻译评估类似于人类:以 ChatGPT 为例的案例研究
本文介绍了新的提示方法(Error Analysis Prompting), 结合 Chain-of-Thoughts 和 Error Analysis, 用于提高 ChatGPT 在机器翻译质量评估方面的性能,并发现了一些其作为 MT 评 - 一家老年医院长期患者管理质量评估系统的实施和评价
研究了一种基于临床决策支持系统的计算机临床指南的质量评估系统在压疮管理领域应用的可行性和效果,并发现其可以提高照护质量、节约时间以及增强医护人员的能力。
- EMNLP会诊清单:标准化医疗记录生成的人类评估
本研究提出使用 Consultation Checklists 作為評估醫療自動生成文本的指標,以提高客觀性和降低專家評估者間的差異。根據實驗結果,使用 Consultation Checklists 作為自動度量標準可以更好地與人工評估相 - PhysiQ:物理治疗中的远程运动质量评估
通过被动传感器检测,PhysiQ 设计了一个新框架,用于跟踪和量化人们的离线锻炼活动,采用多任务时空孪生神经网络对物理治疗质量进行分类和相似度比较,对运动范围、稳定性和重复性进行评估与量化。