Jun, 2024

CTBench: 临床试验设计中评估语言模型能力的综合基准

TL;DRCTBench 是一个用于评估语言模型在辅助临床研究设计方面的基准测试,通过给定特定研究元数据,CTBench 评估人工智能模型在确定临床试验的基线特征方面的能力,包括从所有参与者开始收集的人口统计学和相关特征。