Jun, 2024

MedOdyssey:一个高达200K词的医学领域长文本评估基准

TL;DR提出了MedOdyssey,首个有7个长度级别(从4K到200K标记)的医学长内容基准,评估了大型语言模型(LLMs)在长文本情境中的性能分析。