关键词hallucination issues
搜索结果 - 8
- ToolBeHonest: 一个多层次幻觉诊断基准测试工具,用于帮助扩展的大型语言模型PDF4 days ago
- 使用预设立场进行反事实辩论以消除 LLM 的产生幻觉PDF15 days ago
- VALOR-EVAL: 大型视觉语言模型的整体覆盖和忠实度评估PDF2 months ago
- 为大型视觉语言模型提供定向指导调节,减轻幻觉PDF3 months ago
- Agent-FLAN: 大型语言模型的高效代理调优数据和方法设计PDF3 months ago
- Re-Ex: LLM 响应中的解释修订减少了事实错误PDF4 months ago
- CARBD-Ko:韩语方面级别情感分类的语境注释评测基准数据集PDF4 months ago
- 临床摘要中事实对齐的合成模仿编辑反馈PDF8 months ago
Prev
Next