Jun, 2024

VERISCORE:评估长文生成的可验证主张的真实性

TL;DR现有的方法不能适用于大多数生成任务,VERISCORE是一种用于多样长文本生成任务的度量指标,它包含可验证和不可验证内容,并通过人工评估验证。