Oct, 2023

揭开塞壬之歌:迈向可靠的事实冲突幻觉检测

TL;DR通过 FactCHD 基准测试,评估 Large Language Models 中事实性的判断,在检测虚假信息方面取得了有效成果,且当前方法在准确检测事实错误方面存在不足。