BriefGPT.xyz
大模型
Ask
alpha
关键词
factuality assessment
搜索结果 - 2
直接优化语言模型奖励的视频大型多模态模型
本文介绍了一种新的框架,利用详细的视频字幕作为视频内容的代理,使语言模型能够将此信息作为支持证据,用于评分视频问答(QA)预测,并通过直接将视频帧作为输入的 OpenAI GPT-4V 模型的奖励机制来展示我们的方法与之间的稳健一致性。此外
→
PDF
3 months ago
EMNLP
大型语言模型是否可靠的评判者?一个关于 LLM 事实性评估能力的研究
本研究旨在探讨大型语言模型作为可靠的评估器,用于评估文本生成模型生成的摘要的事实一致性,并发现其在事实性评分中的局限性。
PDF
8 months ago
Prev
Next