关键词question and answering
搜索结果 - 2
- VLM-Eval: 视频大型语言模型的通用评估
本文提出了一个统一的评估方法,包括字幕、问答、检索和行动识别等多个视频任务,展示了基于 GPT 的评估方法在多个方面可以与人类一样的表现,同时也展示了一种简单的基准方法 Video-LLaVA,在评估视频 LLMs 时优于现有方法。此外,我 - 利用预训练语言模型进行从文本中获取对话式信息检索
本论文研究了利用上下文学习和预训练语言表示模型来解决过程描述文档中信息提取的问题,与原生 GPT-3 模型一起,通过注入概念定义和少量样本进行了两个上下文学习操作。研究结果显示了该方法的潜力和上下文学习的有用性,同时也指出了控制流关系所带来