BriefGPT.xyz
大模型
Ask
alpha
关键词
automated evaluation metric
搜索结果 - 4
FineRadScore:一个逐行评估放射学报告的技术,生成带有严重程度评分的纠正
借助 FineRadScore,一种基于大型语言模型的自动化评估指标,能够通过最小化逐行更正的数量,与线下标注的放射科医生意见一致,且与目前最先进的自动化 CXR 评估指标相媲美,用于整体报告质量评估。
PDF
a month ago
CASPR:对比摘要的自动评估指标
本文提出了一种基于自然语言推理(NLI)的自动评估指标 CASPR,用于更好地测量摘要对之间的对比度,并通过对比实验结果表明,CASPR 相比于其他基准方法能够更可靠地捕捉到摘要对之间的对比度。
PDF
2 months ago
放射学感知的基于模型的报告生成评价指标
我们提出了一种适用于放射学领域的新的自动评估度量标准,使用成功的 COMET 架构。通过在放射学知识图谱 RadGraph 上训练和发布四个面向医学的模型检查点,我们的结果表明我们的度量标准与 BERTscore、BLEU 和 CheXbe
→
PDF
7 months ago
ACL
利用丰富的词汇基础实现文本到三维场景生成
该论文介绍了如何使用自然语言描述来学习将文本场景映射到三维几何表示中的方法,并且使用基于规则的方法来生成三维场景的方法得到了改进。他们还引入了一种自动化评估度量来评估生成的 3D 场景。
PDF
9 years ago
Prev
Next