关键词open-ended question-answering
搜索结果 - 2
- 长时间自视角视频中的基于场景的问答
本文旨在解决在长时间自我中心视频中的开放式问题回答,提出一种综合模型来减少错误传播、利用大语言模型进行高效可扩展的数据合成,并引入一个闭合式问题回答任务以管理答案的模糊性。实验证明了我们的方法的有效性,并在 QAEgo4D 和 Ego4D- - 单语或多语指导调优:哪个更好的羊驼
通过使用多语言调优方法研究基础大型语言模型(LLMs)的代价效益,检验了 LLMs 对于单语和多语环境中查询的有效性,并发现多语调优对于 LLMs 在多语环境中的鲁棒性是关键。研究表明,在有限的计算资源情况下,仅使用有限数据集对多语调优模型