关键词quantitative evaluation metrics
搜索结果 - 4
- 大型语言模型在总结放射学报告印象方面的现状
研究了 8 种大型语言模型对放射学报告印象进行总结的能力,使用 CT、PET-CT 和超声波报告构建零、一、三次扫描提示,并定义了五项人工评价指标以评估印象的语义,结果显示大型语言模型在完整性和正确性方面表现较好,但简洁性和真实性评分不高, - 一种基于得分蒸馏采样的文本到 3D 的定量评估
通过定量评估指标、交叉验证人类评级以及分析 SDS 技术的失败案例,我们提出了一种新的计算效率基准模型,以解决生成模型中的艺术问题,包括 3D 模型准确性和文本提示之间的错位问题,并在所提出的评估指标上达到了最先进的性能。
- QualEval: 模型改进的定性评估
提出了一种新的定量评估指标 QualEval,用于改进大型语言模型的定量测量方法。该方法通过使用动态优化求解器生成人类可读的洞察力,加速模型改进,并成功增加了模型开发的速度,成为一种数据科学家工具。
- GlocalNet:基于类别感知的长期人体运动合成
本文旨在解决人体运动合成方面存在的挑战,提出了一种两阶段活动生成方法,通过学习合成稀疏的运动轨迹和生成密集的运动轨迹来实现长期人体运动轨迹的合成,并通过多种量化评估指标证明该方法优于 SOTA 方法。